zl程序教程

您现在的位置是:首页 >  其他

当前栏目

featureCounts的MultiQC结果解读

2023-02-26 10:16:33 时间

本文共2456字,阅读约需7分钟。

在前面我们介绍了MultiQC这个软件,接下来将分期解读MultiQC对多个软件处理后的结果。

本期解读转录组上游分析定量软件featureCounts的结果。

在定量完成以后,我们可以通过如下命令拿到经MultiQC处理的结果。

multiqc result.txt.summary 

其中result.txt.summary为多个样本定量的summary文件,如下

Status  ../genome/W0d_H5S_1.sam ../genome/W0d_H5S_2.sam ../genome/W0d_H5S_3.sam ../genome/W12h_H5S_XM_1.sam     ../genome/W12h_H5S_XM_2.sam     ../genome/W12h_H5S_XM_3.sam    ../genome/W12h_H5S_ZJ_1.sam     ../genome/W12h_H5S_ZJ_2.sam     ../genome/W12h_H5S_ZJ_3.sam     ../genome/W4d_H5S_XM_1.sam      ../genome/W4d_H5S_XM_2.sam     ../genome/W4d_H5S_XM_3.sam      ../genome/W4d_H5S_ZJ_1.sam      ../genome/W4d_H5S_ZJ_2.sam      ../genome/W4d_H5S_ZJ_3.sam
Assigned        19014653        16380425        16001137        16397324        17022447        17257563        20357095        17418628        16731705      18129190 17029418        18299244        17599984        20027615        19097183
Unassigned_Unmapped     3104042 3092936 3046480 2780825 2849854 2843823 3996902 2829139 2725304 2796492 2473837 2715289 2784885 3880517 2871043
Unassigned_Read_Type    0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
Unassigned_Singleton    0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
Unassigned_MappingQuality       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
Unassigned_Chimera      0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
Unassigned_FragmentLength       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
Unassigned_Duplicate    0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
Unassigned_MultiMapping 7002729 6685469 5779516 6012470 6271135 6299551 7183720 6072958 5792098 7572696 6686149 6845406 6580915 7348777 6398929
Unassigned_Secondary    0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
Unassigned_NonSplit     0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
Unassigned_NoFeatures   4357138 3544196 3595771 3579708 3704939 3686892 4470750 3849596 3708928 4190702 3926947 4122400 4093841 4545252 4264114
Unassigned_Overlapping_Length   0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
Unassigned_Ambiguity    19762222        17364090        16896847        17453455        17450339        17164163        21053322        17376653        16844437       19114973        16903418        18388310        18504273        20907632        18764383

处理后得到文件multiqc_report.html,在浏览器中打开即可。

featureCounts的结果一共有两个部分,General Stats和featureCounts。

General Stats

在此部分,我们能直观的看到每个样本有多少reads单一比对到基因注释上,所占的百分比为多少。

举个栗子,W0d_H5S_1有19.0 millions条reads单一比对到基因注释上,占所有reads的35.7%。

General Stats

通过小标题下方的小工具,我们可以对结果作图,看看样本的整体情况。

featureCounts

在此部分,assignments的情况被进一步图表化的展示出来,并且可以选择Number of Reads和Percentages两种展示方式。

Number of Reads

Percentages

举个例子,样品W0d_H5S_1中,有19 014 653条(比General Statistics更精确)reads单一比对到基因注释上,比例为35.7%,其他几项分别为:

  • Unassigned:Unmapped:没有比对到基因组上的reads(可能为测序过程中污染的reads)。
  • Unassigned:Multi Mapping:覆盖了多个feature的reads,官方解释为【A multi-overlap read or fragment is one that overlaps more than one feature,or more than one meta-feature when summarizing at the meta-feature level】。
  • Unassigned:No Features:比对到基因组上尚未注释部分的reads。
  • Unassigned:Ambiguity:无法明确定义位置(模糊不清)的reads。

参考资料:

  1. featureCounts: an efficient general purpose program forassigning sequence reads to genomic features.(2013)