如何对fastq文件进行批量处理
首先进入fastq所在文件夹
#cd /path/to/file
1. 质控
#fastqc -o FASTQC/ -t 8 *.fastq.gz
#multiqc ./
2. 过滤
for i in ls *_combined_R1.fastq.gz
; do i=${i/_combined_R1.fastq.gz/};
nohup cutadapt -a AGATCGGAAGAGCACACGTCTGAACTCCAGTCAC -A
AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT -q 30 -m 75 --trim-n --report=minimal -o
${i}_out_R1.fastq.gz -p ${i}_out_R2.fastq.gz ${i}_combined_R1.fastq.gz
${i}_combined_R2.fastq.gz & done
3. 比对
#for i in ls *_out_R1.fastq.gz
; do i=${i/_out_R1.fastq.gz/}; nohup hisat2 -p
8 --dta -x /path/to/file/hg19/genome -1 ${i}_out_R1.fastq.gz -2
${i}_out_R2.fastq.gz -S ${i}.sam & done
4. 排序
for i in ls *.sam
; do i=${i/.sam/}; nohup samtools sort -@ 8 -o ${i}.bam
${i}.sam & done
5. 计数
#for i in ls *.bam
; do i=${i/.bam/}; nohup featureCounts -T 5 -p -t exon -g
gene_id -a /path/to/file/genes.gtf -o ${i}.featureCounts.txt ${i}.bam & done
featureCounts -T 5 -p -t exon -g gene_id -a /path/to/file/genes.gtf -o
all.id.txt *.bam
6.查看后台进程
#jobs / ps
jobs用于查看当前终端后台运行的任务。ps命令用于查看瞬间进程的动态
当然啦,一样的套路也可以用于其他类型测序数据的分析,想要继续学习的同学可以查看往期文章进行回顾并尝试哦~
相关文章
- 金融服务领域的大数据:即时分析
- 影响大数据、机器学习和人工智能未来发展的8个因素
- 从0开始构建一个属于你自己的PHP框架
- 如何将Hadoop集成到工作流程中?这6个优秀实践必看
- SEO公司使用大数据优化其模型的5种方法
- 关于Web Workers你需要了解的七件事
- 深入理解HTTPS原理、过程与实践
- 增强分析:数据和分析的未来
- PHP协程实现过程详解
- AI专家:大数据知识图谱——实战经验总结
- 关于PHP的错误机制总结
- 利用数据分析量化协同过滤算法的两大常见难题
- 怎么做大数据工作流调度系统?大厂架构师一语点破!
- 2019大数据处理必备的十大工具,从Linux到架构师必修
- OpenCV中的KMeans算法介绍与应用
- 教大家如果搭建一套phpstorm+wamp+xdebug调试PHP的环境
- CentOS下三种PHP拓展安装方法
- Go语言HTTP Server源码分析
- Go语言HTTP Server源码分析
- 2017年4月编程语言排行榜:Hack首次进入前五十