zl程序教程

您现在的位置是:首页 >  其他

当前栏目

【生信文献200篇】87 VCF注释及可视化工具

2023-04-18 14:47:46 时间

00 VCF

Variant Call Format(VCF)是存储基因序列突变信息的文本格式,包括单碱基突变(SNP), 插入/缺失(InDel), 拷贝数变异和结构变异等。

该文件包括注释信息和变异信息,注释信息以#开头,描述VCF版本信息等,变异信息以列表形式存储:

#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO
1       10177   rs201752861     A       C       .       .       RS=201752861;RSPOS=10177;dbSNPBuildID=137;SSR=0;SAO=0;VP=0x050000020005000002000100;GENEINFO=DDX11L1:100287102;WGT=1;VC=SNV;R5;ASP

每列信息的具体解释可以参考:

转载-VCF格式详解 | 生信菜鸟团 (bio-info-trainee.com)

01 myVCF-2017

Pietrelli A, Valenti L. myVCF: a desktop application for high-throughput mutations data management. Bioinformatics. 2017;33(22):3676-3678. doi:10.1093/bioinformatics/btx475

myVCF是基于Django(一个开源Python web框架,https://djangoproject.com)开发的,网页的架构、设计和功能是使用Bootstrap framework 和几个 Javascript 库一起开发的,其导出功能通过 libraries 进行。

myVCF支持Annovar和VEP注释,其主要功能是浏览VCF文件中的信息,并导出突变数据的可视化平台,可查询的信息包括:chromosomal region, gene, single variant 及 dbSNP ID。

myVCF提供了外部资源的链接,如ClinVar数据库和UCSC。还整合了公共数据库中与等位基因频率相关的信息,such as the 1000 Genomes project, ESP, the Exome Aggregation Consortium together with in silico predictor tools such as Polyphen2 and SIFT.

myVCF既可以进行单个VCF文件的质控报告,也可以进行多样本多染色体的突变分布查询。

开发者的意图是为了帮助没有强大生物信息学技能的用户以一种信息丰富、直接、直观和灵活的方式接触突变数据和相关注释。

myVCF的使用

开发者提供了myVCF使用的说明书,详细介绍了如何下载安装使用myVCF:myVCF — myVCF latest documentation

02 Personal Cancer Genome Reporter - 2018

Nakken S, Fournous G, Vodák D, Aasheim LB, Myklebost O, Hovig E. Personal Cancer Genome Reporter: variant interpretation report for precision oncology. Bioinformatics. 2018;34(10):1778-1780. doi:10.1093/bioinformatics/btx817

开发者旨在开发临床相关的个人肿瘤基因报告软件PCGR,整合了肿瘤与临床biomarker,将体细胞变异注释和临床相连。PCGR的安装使用说明可通过 https://github.com/sigven/pcgr 获得。

PCGR 支持输入两种文件:

  • a single-sample VCF file encoding the genomic coordinates of somatic SNVs/indels
  • a basic somatic copy number segment file that encodes chromosomal segment locations and their log-2 ratios

开发者主要通过四个步骤生成报告:

(1)使用VEP进行变异注释;

(2)使用vcfanno进行等位基因特异性注释;

(3)结合肿瘤的基因功能注释;

(4)评估突变评分并用R生成报告。所有软件组件都是通过Docker技术集成和提供的。

03 VCF-Server-2019

Jiang, J., Gu, J., Zhao, T., & Lu, H. (2019). VCF-Server: A web-based visualization tool for high-throughput variant data mining and management. Molecular genetics & genomic medicine, 7(7), e00641. https://doi.org/10.1002/mgg3.641

VCF-server是一个基于web的交互式分析的可视化工具。The tool is freely available for use at https://www.diseasegps.org/VCF-Server?lan = eng.

VCF-Server是一个基于Browser/Server架构的web应用程序,前端是用Sails.js编写的,并使用node.js框架构建。后端用perl-cgi实现。既支持Web分析,又提供了Docker版本,并且该项目是完全开源的,其源代码在https://github.com/biojiang/vcf-server 。

用户可以进行查看VCF文件,注释及过滤变量,并进行结果可视化。VCF-Server可直接处理未解压的VCF文件,并支持上传一个或多个VCF文件。每个VCF文件可以选择ANNOVAR, SnpEFF, or Variant Effect Predictor (VEP) 不同的注释方法,目前,VCF-Server接受HG19/GRCH37或HG38/GCH38版本的人类基因组的下游功能注释和分析。

开发人员还系统地比较了VCF- server与现有的四种VCF可视化和挖掘工具:

04 VCFview-2020

O'Sullivan, Brian, and Cathal Seoighe. “vcfView: An Extensible Data Visualization and Quality Assurance Platform for Integrated Somatic Variant Analysis.” Cancer informatics vol. 19 1176935120972377. 11 Nov. 2020, doi:10.1177/1176935120972377

开发者开发了一个交互式工具VCFview,https://github.com/brianosullivangit/vcfview,该工具是通过shiny开发的,输入文件为VCF,旨在评估体细胞突变的突变类型,突变信号和目标蛋白突变的功能影响。

其可视化界面:

主要界面是VAF密度图,显示体细胞突变的频谱,右侧可供用户进行质控过滤。

延伸:

VariantQC:变异vcf文件可视化;变异vcf文件可视化神器:VariantQC (qq.com)

SureCall :从比对到生存突变报告的工具;www.agilent.com/genomics/surecall