ChIP-seq 分析:Mapped 数据可视化(4)
2023-03-07 09:41:24 时间
1. Mapped reads
现在我们有了 BAM 文件的索引,我们可以使用 idxstatsBam() 函数检索和绘制映射读取的数量。
mappedReads <- idxstatsBam("SR_Myc_Mel_rep1.bam")
TotalMapped <- sum(mappedReads[, "mapped"])
ggplot(mappedReads, aes(x = seqnames, y = mapped)) + geom_bar(stat = "identity") +
coord_flip()
2. bigWig 创建
我们还可以从我们排序的、索引的 BAM 文件中创建一个 bigWig,以允许我们快速查看 IGV 中的数据。
首先,我们使用 coverage() 函数创建一个包含我们的覆盖率分数的 RLElist 对象。
forBigWig <- coverage("SR_Myc_Mel_rep1.bam")
forBigWig
我们现在可以使用 rtracklayer 包的 export.bw() 函数将 RLElist 对象导出为 bigWig。
library(rtracklayer)
export.bw(forBigWig, con = "SR_Myc_Mel_rep1.bw")
我们可能希望标准化我们的覆盖范围,以便我们能够比较样本之间的富集。
我们可以使用 coverage() 中的权重参数将我们的读取缩放到映射读取数乘以一百万(每百万读取数)。
forBigWig <- coverage("SR_Myc_Mel_rep1.bam", weight = (10^6)/TotalMapped)
forBigWig
export.bw(forBigWig, con = "SR_Myc_Mel_rep1_weighted.bw")
相关文章
- 数据孤岛是业务效率的无声杀手
- 2023展望:新的一年将给大数据分析领域带来什么?
- 阿里云ADB基于Hudi构建Lakehouse的实践
- 大数据在医疗保健领域的使用案例
- 微软增加说明:KB5021751 更新扫描已经 / 即将过时 Office 过程中不会触碰用户隐私
- 2022 Gartner全球云数据库管理系统魔力象限发布 腾讯云数据库入选
- 场景化、重实操,分享一个实时数仓实践案例
- Arctic的湖仓一体践行之路
- 分布式计算MapReduce究竟是怎么一回事?
- 淘系数据模型治理优秀实践
- 大数据分析对医疗保健的影响
- 当我们说大数据Hadoop,究竟在说什么?
- 2022年及以后大数据的五个发展趋势
- 网易严选离线数仓治理实践
- 2023 年数据治理趋势
- 一份“靠谱”的年度经营计划,你学会了吗?
- 漫谈对大数据的思考
- 测试一下,读懂数据的能力,你有吗?
- 用艺术的眼光探索数据之美
- 聊聊数据分析成果如何落地