如何从TCGA数据库下载DNA甲基化数据
前面给大家介绍了新版的TCGA数据库,通过文字和视频给大家讲解了如何从TCGA数据库下载RNAseq数据,miRNAseq数据以及体细胞突变数据
以及如何合并成矩阵
☞ 【视频讲解】R代码合并新版TCGA中RNAseq表达谱矩阵
☞ 【视频讲解】R代码合并新版TCGA中miRNA表达谱矩阵
☞ 【R实战】使用maftools复现SCI文章中的体细胞突变瀑布图
今天小编就来跟大家聊聊,如何从TCGA数据库中下载DNA甲基化数据。我们还是以TCGA-CHOL(胆管癌)这套数据给大家举例。
1. 打开TCGA数据库官网,https://portal.gdc.cancer.gov/。在对话框中输入想要查找的肿瘤的名称。这里以TCGA-CHOL这套数据为例。点击PR, TCGA-CHOL。
2. 点击Methylation Array后面的36(Cases数)。TCGA里面的DNA甲基化数据大多数是采用illumina的450K甲基化芯片检测得到的。
3. 在跳转的页面中,点击左上角的Files,然后勾选Methylation Beta Value。这个时候,文件数就从原来的145个变成了45个。最后点击Add All Files to Cart。
4.点击右上角的Cart,然后点击Sample Sheet,下载样本信息表,得到gdc_sample_sheet.2022-08-06.tsv文件。
5. 点击download,选择Cart,进行下载。会得到一个.tar.gz的压缩文件gdc_download_20220806_013206.570127.tar.gz。这个里面就是45个样本的甲基化数据了。
6. 创建一个TCGA_CHOL文件夹,然后在TCGA_CHOL下创建一个methylation文件夹,将gdc_download_20220806_013206.570127.tar.gz拷贝到methylation里解压。前面下载的gdc_sample_sheet.2022-08-06.tsv拷贝到TCGA_CHOL,更名为methylation_sample_sheet.tsv。最终得到的文件夹结构如下
methylation文件夹的结果如下,包含45个单独的文件夹
每个文件夹下面是一个样本的DNA甲基化数据
打开这个betas.txt文件,内容如下。第一列为450K芯片的探针ID,每一个对应一个CpG位点,后面是代表甲基化水平的beta值,从0-1,0表示完全非甲基化,1表示完全甲基化。
今天的分享就先到这里,后面我们会给大家讲解如何使用R代码将这45个样本的甲基化值合并成一个矩阵。
相关文章
- [GBD数据库挖掘] 1.数据的下载与整合
- 数据库学习笔记【自学教程】—— 如何建立数据库
- Java JDBC和数据库连接池
- Linux安装MySQL数据库的简易指南(linux下载mysql)
- 快速下载Oracle数据库实战宝典(oracle数据下载)
- Oracle 11g 64位版本下载:获取最新的数据库功能(oracle11g64位下载)
- 洞察Oracle数据库中触发器的类型(oracle触发器类型)
- 探索批量导入MSSQL数据库中的图片(批量导入mssql图片)
- 表如何删除MSSQL数据库中的表(如何删除mssql)
- MySQL强力驱动ARM数据库发展(arm数据库mysql)
- APT一键安装MySQL,快速解决数据库问题(apt 下载mysql)
- MySQL数据库必须设置主键(mysql一定要设置主键)
- MySQL解析器优化你的数据库查询效率(mysql_parse)
- MySQL下载源稳定快速的数据库管理工具(mysql下载源)
- MySQL数据库下载游戏名字的存储利器(MYSQL下载游戏名字)
- 快抢先下载MySQL,数据库管理的首选神器(mysql下载嗷嗷快)
- 选择正确的MySQL版本,下载更好的数据库管理工具(mysql下载哪个版本好)
- MySQL免费版下载,专业数据库管理好帮手(mysql下载免费版)
- Oracle数据库中文字段名长度限制(oracle中文列名长度)
- Oracle数据库中对数据的分段统计分析(oracle中分段统计)
- 原则Oracle数据库中主键命名规范(oracle中主键命名)
- ORACLE数据库搭建简易指南下载文档制作(ORACLE下载文档制作)
- 下载Oracle客户端,轻松操作数据库(oracle下载客户端)