【生信文献200篇】87 VCF注释及可视化工具
00 VCF
Variant Call Format(VCF)是存储基因序列突变信息的文本格式,包括单碱基突变(SNP), 插入/缺失(InDel), 拷贝数变异和结构变异等。
该文件包括注释信息和变异信息,注释信息以#开头,描述VCF版本信息等,变异信息以列表形式存储:
#CHROM POS ID REF ALT QUAL FILTER INFO
1 10177 rs201752861 A C . . RS=201752861;RSPOS=10177;dbSNPBuildID=137;SSR=0;SAO=0;VP=0x050000020005000002000100;GENEINFO=DDX11L1:100287102;WGT=1;VC=SNV;R5;ASP
每列信息的具体解释可以参考:
转载-VCF格式详解 | 生信菜鸟团 (bio-info-trainee.com)
01 myVCF-2017
Pietrelli A, Valenti L. myVCF: a desktop application for high-throughput mutations data management. Bioinformatics. 2017;33(22):3676-3678. doi:10.1093/bioinformatics/btx475
myVCF是基于Django(一个开源Python web框架,https://djangoproject.com)开发的,网页的架构、设计和功能是使用Bootstrap framework 和几个 Javascript 库一起开发的,其导出功能通过 libraries 进行。
myVCF支持Annovar和VEP注释,其主要功能是浏览VCF文件中的信息,并导出突变数据的可视化平台,可查询的信息包括:chromosomal region, gene, single variant 及 dbSNP ID。
myVCF提供了外部资源的链接,如ClinVar数据库和UCSC。还整合了公共数据库中与等位基因频率相关的信息,such as the 1000 Genomes project, ESP, the Exome Aggregation Consortium together with in silico predictor tools such as Polyphen2 and SIFT.
myVCF既可以进行单个VCF文件的质控报告,也可以进行多样本多染色体的突变分布查询。
开发者的意图是为了帮助没有强大生物信息学技能的用户以一种信息丰富、直接、直观和灵活的方式接触突变数据和相关注释。
myVCF的使用
开发者提供了myVCF使用的说明书,详细介绍了如何下载安装使用myVCF:myVCF — myVCF latest documentation
02 Personal Cancer Genome Reporter - 2018
Nakken S, Fournous G, Vodák D, Aasheim LB, Myklebost O, Hovig E. Personal Cancer Genome Reporter: variant interpretation report for precision oncology. Bioinformatics. 2018;34(10):1778-1780. doi:10.1093/bioinformatics/btx817
开发者旨在开发临床相关的个人肿瘤基因报告软件PCGR,整合了肿瘤与临床biomarker,将体细胞变异注释和临床相连。PCGR的安装使用说明可通过 https://github.com/sigven/pcgr 获得。
PCGR 支持输入两种文件:
- a single-sample VCF file encoding the genomic coordinates of somatic SNVs/indels
- a basic somatic copy number segment file that encodes chromosomal segment locations and their log-2 ratios
开发者主要通过四个步骤生成报告:
(1)使用VEP进行变异注释;
(2)使用vcfanno进行等位基因特异性注释;
(3)结合肿瘤的基因功能注释;
(4)评估突变评分并用R生成报告。所有软件组件都是通过Docker技术集成和提供的。
03 VCF-Server-2019
Jiang, J., Gu, J., Zhao, T., & Lu, H. (2019). VCF-Server: A web-based visualization tool for high-throughput variant data mining and management. Molecular genetics & genomic medicine, 7(7), e00641. https://doi.org/10.1002/mgg3.641
VCF-server是一个基于web的交互式分析的可视化工具。The tool is freely available for use at https://www.diseasegps.org/VCF-Server?lan = eng.
VCF-Server是一个基于Browser/Server架构的web应用程序,前端是用Sails.js编写的,并使用node.js框架构建。后端用perl-cgi实现。既支持Web分析,又提供了Docker版本,并且该项目是完全开源的,其源代码在https://github.com/biojiang/vcf-server 。
用户可以进行查看VCF文件,注释及过滤变量,并进行结果可视化。VCF-Server可直接处理未解压的VCF文件,并支持上传一个或多个VCF文件。每个VCF文件可以选择ANNOVAR, SnpEFF, or Variant Effect Predictor (VEP) 不同的注释方法,目前,VCF-Server接受HG19/GRCH37或HG38/GCH38版本的人类基因组的下游功能注释和分析。
开发人员还系统地比较了VCF- server与现有的四种VCF可视化和挖掘工具:
04 VCFview-2020
O'Sullivan, Brian, and Cathal Seoighe. “vcfView: An Extensible Data Visualization and Quality Assurance Platform for Integrated Somatic Variant Analysis.” Cancer informatics vol. 19 1176935120972377. 11 Nov. 2020, doi:10.1177/1176935120972377
开发者开发了一个交互式工具VCFview,https://github.com/brianosullivangit/vcfview,该工具是通过shiny开发的,输入文件为VCF,旨在评估体细胞突变的突变类型,突变信号和目标蛋白突变的功能影响。
其可视化界面:
主要界面是VAF密度图,显示体细胞突变的频谱,右侧可供用户进行质控过滤。
延伸:
VariantQC:变异vcf文件可视化;变异vcf文件可视化神器:VariantQC (qq.com)
SureCall :从比对到生存突变报告的工具;www.agilent.com/genomics/surecall
相关文章
- 【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
- CLB运维&运营最佳实践 ---访问日志大洞察
- vnc方式登陆服务器
- 轻松学排序算法:眼睛直观感受几种常用排序算法
- 十二个经典的大数据项目
- 为什么使用 CDN 内容分发网络?
- 大数据——大数据默认端口号列表
- Weld 1.1.5.Final,JSR-299 的框架
- JavaFX 2012:彻底开源
- 提升as3程序性能的十大要点
- 通过凸面几何学进行独立于边际的在线多类学习
- 利用行动影响的规律性和部分已知的模型进行离线强化学习
- ModelLight:基于模型的交通信号控制的元强化学习
- 浅谈Visual Source Safe项目分支
- 基于先验知识的递归卡尔曼滤波的代理人联合状态和输入估计
- 结合网络结构和非线性恢复来提高声誉评估的性能
- 最佳实践丨云开发CloudBase多环境管理实践
- TimeVAE:用于生成多变量时间序列的变异自动编码器
- 具有线性阈值激活的神经网络:结构和算法
- 内网渗透之横向移动 -- 从域外向域内进行密码喷洒攻击