您现在的位置是：首页 > 大数据

当前栏目

ChIP-seq 分析：数据质控实操（5）

数据分析实操 Seq ChIP 质控

2023-06-13 09:17:03 时间

1. 数据

今天将继续回顾我们在上一次中研究的 Myc ChIPseq。这包括用于 MEL 和 Ch12 细胞系的 Myc ChIPseq 及其输入对照。

可在此处找到 MEL 细胞系中 Myc ChIPseq 的信息和文件
可在此处找到 Ch12 细胞系中 Myc ChIPseq 的信息和文件
可以在此处找到 MEL 细胞系的输入控制
可在此处找到 Ch12 细胞系的输入对照。

2. 质量控制

ChIPseq 有许多潜在噪声源，包括 抗体的不同效率 非特异性结合 文库复杂性 ChIP 伪影和背景。

许多这些噪声源都可以使用一些完善的方法进行评估。

2.1. 质控参考

Encode 质量指标。

Large-scale quality analysis of published ChIPseq data. Marinov GK, Kundaje A, Park PJ, Wold BJ. G3 (Bethesda). 2014 Feb 19;4(2)

ChIPseq 中人工制品重复的高估。

Systematic evaluation of factors influencing ChIPseq fidelity.Nat Methods. Chen Y, Negre N, Li Q, Mieczkowska JO, Slattery M, Liu T, Zhang Y, Kim TK, He HH, Zieba J, Ruan Y, Bickel PJ, Myers RM, Wold BJ, White KP, Lieb JD, Liu XS. 2012 Jun;9(6)

什么时候 QC 有用。

Impact of artifact removal on ChIP quality metrics in ChIPseq and ChIP-exo data.Front Genet. 2014 Apr 10;5:75.Carroll TS, Liang Z, Salama R, Stark R, de Santiago I

2.2. 合适的输入

在 IP 富集之前，输入样本通常由片段化的 DNA 制成。
允许控制样本中出现的伪影区域。
切勿在不考虑使用哪个输入的情况下运行 ChIPseq。

例如：当使用肿瘤样本进行 ChIPseq 时，匹配输入样本很重要。同一组织的不同条件可能共享共同的输入。

2.3. 质量指标

ChIPQC 包将一些指标包装到 Bioconductor 包中，并注意在适当的条件下测量这些指标。

要运行单个样本，我们可以使用 ChIPQCsample() 函数、相关的未过滤 BAM 文件，我们建议提供黑名单作为 BED 文件或 GRanges 和基因组名称。

您可以在 Anshul Kundaje 的网站或直接从 Encode 网站找到大多数基因组的黑名单

QCresult <- ChIPQCsample(reads = "/pathTo/myChIPreads.bam", genome = "mm10", blacklist = "/pathTo/mm10_Blacklist.bed")

我们从 Encode 下载 mm10 的黑名单。然后，我们可以使用 ChIPQC 包中的 ChIPQCsample() 函数对我们的 ChIPseq 样本质量进行初步分析。

在这里，我们评估我们在之前的会话中使用 Rsubread 对齐的样本的质量。返回的对象是 ChIPQCsample 对象。

library(ChIPQC)
toBlkList <- "~/Downloads/ENCFF547MET.bed.gz"
chipqc_MycMel_rep1 <- ChIPQCsample("SR_Myc_Mel_rep1.bam", annotation = "mm10", blacklist = toBlkList,
    chromosomes = paste0("chr", 1:10))
class(chipqc_MycMel_rep1)

chipqc_MycMel_rep1

我们可以显示我们的 ChIPQCsample 对象，它将显示我们的 ChIPseq 质量的基本摘要。

chipqc_MycMel_rep1

chipqc_MycMel_rep1

2.4. 多样本QC

最好对照您的输入对照和我们正在使用的其他 Myc 样本（如果您没有自己的数据，甚至是外部数据）检查 ChIPseq 质量。

这将使我们能够识别样本与对照中 ChIPseq 富集的预期模式，并通过这些指标发现任何异常样本。

我们可以使用 lapply 对所有感兴趣的样本运行 ChIPQCsample()。

bamsToQC <- c("Sorted_Myc_Ch12_1.bam", "Sorted_Myc_Ch12_2.bam", "Sorted_Myc_MEL_1.bam",
    "Sorted_Myc_MEL_2.bam", "Sorted_Input_MEL.bam", "Sorted_Input_Ch12.bam")
myQC <- bplapply(bamsToQC, ChIPQCsample, annotation = "mm10", blacklist = toBlkList,
    chromosomes = paste0("chr", 1:10))
names(myQC) <- bamsToQC

所有 ChIPQC 函数都可以与 ChIPQCsample 对象的命名列表一起使用，以将分数聚合到表和图中。

在这里，我们使用 QCmetrics() 函数来概述质量指标。

QCmetrics(myQC)

myQC

猜你喜欢

PHP5中使用DOM控制XML实现代码
JS网站性能优化笔记
Windows7与Linux的联合使用（win7加linux）
使用VisualStudio开发php的图文设置方法
278. 第一个错误的版本
研究Oracle数据库中的触发器类型（oracle触发器类型）
R语言怎么计算两个比值的 p 值？
Oracle利用SQL实现数据统计功能（oracle统计sql）
阿里“宝妈级”之作,这份Spring Security应用到源码手册,全是精华
SQL Server：构建完美的全联接（sqlserver全联接）
上传图片时JS自动显示图片
Oracle写入语句熟悉即可操作（oracle写入语句）
我，40岁码农，还在荷兰写低级代码，不敢回国…
最佳MSSQL数据库结构视图结构构建之道（最好mssql结构视图）
apache中使用.htaccess文件缓存图片的配置方法
MySQL C语言批量插入功能实现方法简介（mysqlc批量插入）
Arthas-java应用排障利器
的复杂安装MySQLD：艰巨的MySQL安装之旅（mysqldmysql）
java 使用 Common IO 包的 FileUtils 将文件大小转成适合阅读的格式详解编程语言
Redis：革命性的内存数据库（redis内存数据库）

zl程序教程