zl程序教程

您现在的位置是:首页 >  Java

当前栏目

多基因风险预测模型2--相关概念和软件

2023-02-18 16:28:20 时间

计算PRS时,设计到的概念和常用的软件,这里整理一下。

1. PRS和GRS

PRS,polygenic risk score,多基因风险评分

GRS,genetic risk score,遗传风险评分

目前,一般用PRS,因为我们在预测风险评分时,用到的是多基因的模型。

2,impute4

填充软件,现在最新版本是impute5

官网:https://jmarchini.org/software/#impute-5

软件下载地址:https://www.dropbox.com/sh/mwnceyhir8yze2j/AADbzP6QuAFPrj0Z9_I1RSmla?dl=0

介绍:

❝IMPUTE 5 is a genotype imputation method that can scale to reference panels with millions of samples. This method continues to refine the observation made in the IMPUTE2 method, that accuracy is optimized via use of a custom subset of haplotypes when imputing each individual. It achieves fast, accurate, and memory-efficient imputation by selecting haplotypes using the Positional Burrows Wheeler Transform (PBWT). By using the PBWT data structure at genotyped markers, IMPUTE 5 identifies locally best matching haplotypes and long identical by state segments. The method then uses the selected haplotypes as conditioning states within the IMPUTE model. IMPUTE5 is up to 30x faster than MINIMAC4 and up to 3x faster than BEAGLE5.1 ❞

3. plink2

plink目前应用比较广泛的两个版本:

  • 1.9
  • 2.0

plink1.9下载地址:https://www.cog-genomics.org/plink/

plink2.0下载地址:https://www.cog-genomics.org/plink/2.0/

目前,我使用的是1.9版本,看来也要学习2.0的使用方法了,数据量大时2.0更快,而且功能更强大,不过语法有所变化。

4. rstpm2R包

R包:rstpm2,主要用于进行柔性参数生存模型,计算不同因素的结果,然后进行绘图。

5. 多基因风险评分PRS依赖的因素

第一个:个体的遗传变异。这部分是通过基因检测比如重测序、芯片得到的基因分型,就是SNP信息。

第二个:遗传变异效应值。这部分是通过GWAS分析得到的BETA或者OR值,就是不同分型的效应值。

我们可以将第一部分SNP的分型值(比如0-1-2),乘以SNP的效应值(比如-0.2)得到一个位点的得分,将多个位点的值累加,就是PGS。

6. PRSice-2软件

下一节介绍这个软件的安装及使用方法。