同样的过亿的测序片段为什么得到的fastq文件大小迥异
2023-02-18 16:30:35 时间
最近看到了某个课题组的单个组学测序数据而且就一个样品,居然在2020到2022发了五篇类似的文章。大家都知道一次差异分析可以拿到成百上千个上下调基因,所以研究者就从上下调基因里面根据变化倍数排序,一个个基因独立发文章,都使用这一个数据集。真的是,物尽其用了!
好奇之下,我就去看了看这个数据集,蛮有意思的,确实是一个样品,但是有两个不同的ngs组学技术,所以有两个ID,同样的过亿的测序片段,得到的fastq文件大小迥异,大家也可以自己点进去看看:
- https://www.ncbi.nlm.nih.gov/sra?linkname=bioproject_sra_all&from_uid=391554
如下所示:
fastq文件大小迥异
可以进入这两个样品看reads详情:
- https://trace.ncbi.nlm.nih.gov/Traces/?view=run_browser&page_size=10&acc=SRR5753903&display=reads
- https://trace.ncbi.nlm.nih.gov/Traces/?view=run_browser&page_size=10&acc=SRR5753916&display=reads
文件比较小的是miRNA测序
网页描述是:
Library:
Instrument: HiSeq X Ten
Strategy: miRNA-Seq
Source: TRANSCRIPTOMIC
Selection: PCR
Layout: SINGLE
可以看到是单端 30bp 的测序片段:
单端 30bp 的测序片段
文件比较大的是WGS
虽然网页描述是:
Library:
Instrument: HiSeq X Ten
Strategy: WGS
Source: GENOMIC
Selection: PCR
Layout: PAIRED
但是这个数据集被这个研究者发了五篇文章,文章里面都说这个是转录组测序,蛮有意思的,我现在也不知道该相信哪个了。
可以看到双端150bp的测序片段:
双端150bp的测序片段
现在是多组学时代,其实这些各个技术流程的视频教程好几年前我就全部免费共享在b站,而且我同步分享了视频配套讲义和教辅材料;
- 学徒第1月,基础知识介绍掌握:文档链接:https://mubu.com/doc/38tEycfrQg 密码:vl3q
- 学徒第2月,RNA-seq数据分析实战训练:文档链接:https://mubu.com/doc/38y7pmgzLg 密码:p6fo
- 学徒第3月,WES数据分析实战训练:文档链接:https://mubu.com/doc/1iDucLlG5g 密码:7uch
- 学徒第4月,ChIP-seq数据分析实战训练:文档链接:https://mubu.com/doc/11taEb9ZYg 密码:wk29
也为每个组学视频课程,设置了练习题,不知道大家是否有学习呢?甚至形成了专门的学徒作业系列:
基本上每个过来我这边学习一个月以上的学徒我都会让他们学习多种组学(围绕着中心法则),而且有了Linux基础和R语言能力后, 跟着我们的视频教程很容易就学会基础流程,毫无压力。
相关文章
- docker高级篇第三章-dockerfile案例之制作自己的centos镜像
- Lightroom Classic 2022 for Mac(Lrc2022) 11.5中文版
- java基于ssh的旅游系统
- java论坛贴子网站ssm论坛项目发帖子网站论坛系统论坛源码
- java美食论坛系统发帖子系统美食论坛网站美食分享论坛源码
- ACDSee 2023软件下载和安装教程
- ACDSee 2022软件下载和安装教程
- LPCG:用激光点云指导单目的3D物体检测
- ACDSee 2021软件下载和安装教程
- ACDSee 2020软件下载和安装教程
- ACDSee 2019软件下载和安装教程
- 深度学习算法原理——RCNN
- 2023年机器学习趋势分析
- 实时语义SLAM:激光+IMU+GPS/MAV
- VP-SLAM:具有点、线和灭点的单目实时VSLAM
- Adobe Acrobat 9 Pro软件安装教程(一款强大的PDF编辑软件)
- PDF编辑器Acrobat DC(PDF) 功能简介+安装破解
- PDF编辑软件:Adobe Acrobat DC
- Acrobat DC 2019 For Mac软件安装教程
- Acrobat Pro DC2021软件安装教程