ChIP-seq 分析:Peak 注释与可视化(9)
1. 基因注释
到目前为止,我们一直在处理对应于转录因子结合的 ChIPseq 峰。顾名思义,转录因子可以影响其靶基因的表达。
转录因子的目标很难单独从 ChIPseq 数据中确定,因此我们通常会通过一组简单的规则来注释基因的峰:
如果峰与基因重叠,则通常将峰注释为基因。
2. Peak 注释
ChIPseeker 是一个有用的基因峰注释包。通过在小鼠 TXDB 对象(mm10 基因组)的来源中使用预定义的注释,ChIPseeker 将为我们提供峰落在基因中的位置以及到 TSS 位点的距离的概览。
首先加载下一部分所需的库。
library(TxDb.Mmusculus.UCSC.mm10.knownGene)
library(org.Mm.eg.db)
library(GenomeInfoDb)
library(ChIPseeker)
annotatePeak 函数接受要注释的区域的 GRanges 对象、基因位置的 TXDB 对象和要从中检索基因名称的数据库对象名称。
peakAnno <- annotatePeak(macsPeaks_GR, tssRegion = c(-500, 500), TxDb = TxDb.Mmusculus.UCSC.mm10.knownGene,
annoDb = "org.Mm.eg.db")
peakAnno <- annotatePeak(macsPeaks_GR, tssRegion = c(-500, 500), TxDb = TxDb.Mmusculus.UCSC.mm10.knownGene,
class(peakAnno)
peakAnno
结果是一个包含峰注释和整体注释统计信息的 csAnno 对象。
peakAnno
peakAnno
csAnno 对象包含有关基因的单个峰的注释信息。要从 csAnno 对象中提取它,ChIPseeker 函数 as.GRanges 或 as.data.frame 可用于生成具有峰及其相关基因的相应对象。
peakAnno_GR <- as.GRanges(peakAnno)
peakAnno_DF <- as.data.frame(peakAnno)
peakAnno_GR[1:2, ]
peakAnno_GR
3. 可视化 Peak 注释
现在我们有了来自 ChIPseeker 的注释峰,我们可以使用 ChIPseeker 的一些绘图功能来显示基因特征中峰的分布。在这里,我们使用 plotAnnoBar 函数将其绘制为条形图,但 plotAnnoPie 会生成类似于饼图的图。
plotAnnoBar(peakAnno)
plotAnnoBar
同样,我们可以绘制 TSS 站点周围峰值的分布。
plotDistToTSS(peakAnno)
plotDistToTSS
ChIPseeker 还可以提供一个简洁的图来描述注释之间的重叠。
upsetplot(peakAnno, vennpie = F)
upsetplot
相关文章
- 大作业——新冠肺炎疫情的数据采集和可视化分析系统
- 【CLS 数据淘金第一期】负载均衡 CLB 日志可视化分析大洞察
- uIP协议栈分析_协议栈
- JS动画卡顿分析_学会java就能自己设计软件吗
- [Python从零到壹] 十八.可视化分析之Basemap地图包入门详解
- 煤矿视频监控分析系统
- 模型分析结果无法可视化展示?!快来看看这个一键式工具吧~~
- java 内存分析工具 生成 dump_java内存检测工具
- scRNA分析|Marker gene 可视化 以及 细胞亚群注释--你是如何人工注释的?
- python如何获取数据并做可视化分析
- GWAS分析中可视化:QQ图和曼哈顿图
- R语言统计学DOE实验设计:用平衡不完全区组设计(BIBD)分析纸飞机飞行时间实验数据
- 本地缓冲区溢出分析
- 数据分享|R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化|附代码数据
- R语言空气污染数据的地理空间可视化和分析:颗粒物2.5(PM2.5)和空气质量指数(AQI)|附代码数据
- openAi未来发展趋势分析
- 自主AI能力加速企业智能化转型 | 爱分析报告
- R语言、SAS潜类别(分类)轨迹模型LCTM分析体重指数 (BMI)数据可视化|附代码数据
- 【Groovy】MOP 元对象协议与元编程 ( Groovy 类内部和外部分别获取 metaClass | 分析获取 metaClass 操作的字节码 | HandleMetaClass 注入方法 )
- 【Linux 内核 内存管理】物理内存组织结构 ⑤ ( 内存区域 zone 类型简介 | 内存区域类型zone_type 枚举源码分析 | zone_type 枚举源码 )
- 广州上海高比例无症状感染者数据从何而来——基于核酸检测准确性的分析
- R语言时变向量自回归(TV-VAR)模型分析时间序列和可视化|附代码数据
- 【BIM建筑建模分析】Revit 2024中文版下载安装
- Linux内核架构:深入理解和分析(linux内核架构)
- 分析利用Oracle数据分析技术提升时间段可视化(oracle时间段数据)
- 研究Oracle触发器类型:实用技巧分析(oracle触发器类型)
- MongoDB 可视化分析:开启全新数据视界(mongodb可视化软件)
- MySQL内核分析MyISAM和InnoDB的不同(mysql两种内核)
- Oracle的一致性读操作原理分析(Oracle一致读原理)
- CSS兼容要点分析
- C#匿名方法与Delegate类型转换错误分析