zl程序教程

您现在的位置是:首页 >  Java

当前栏目

多基因风险预测模型1--先立Flag

2023-02-18 16:28:20 时间

大家好,我是邓飞。我要系统学习掌握多基因风险评分(PRS)和孟德尔随机化(MR),并建立一个专栏,欢迎感兴趣的小伙伴一起交流学习。

我的观察:

  • 学植物的对于动物方面的分析,隔行如隔山,同样的GWAS分析,动物中有场年季效应,有重复力模型,对于植物来说,如听天书。
  • 学动物的,对于植物中的一年多点、多年多点,BLUE值,也是一脸迷惑。

我对动植物数据分析都有接触,经过发现共同点,理解不同点,现在算是上路了。但是对于人类的数据分析,比如多基因风险预测模型和孟德尔随机化分析,真是朦朦胧胧,学习起来也是倍感吃力,屡次想放弃。

这时,我想起两句名言警句:

1,君子不器

2,当你不会某件事情时,就以此为题目写本书吧

写书不至于,但是读书笔记也是可以安排的。

上一次系统笔记还是学习GWAS的时候,写了一本GWAS的学习笔记,很多人给我回信说是帮助极大,因为我是从初学者的角度写笔记,对于初学者是很友好的。很多高手都忘记了当初进阶的艰难,在写书时总是严谨的逻辑的理性的公式推导的书籍,那是教科书!

所以,我要用互联网的思路写笔记,迭代,不断的迭代,允许错误,允许不完美,然后慢慢完善,1.0, 2.0 依次类推。

「多基因遗传风险评分的作用」

看一下文献中的介绍吧:

「文献信息:」

❝朱猛, 吕筠, 余灿清, 黄艳倩, 马红霞, 靳光付, 郭彧, 裴培, 陈铮鸣, 沈洪兵, 胡志斌, 李立明, 代表中国慢性病前膽性研究项目协作组. 多基因遗传风险评分指导肺癌个体化筛查的前瞻性队列研究. 中华流行病学杂志, 2021, 42(3): 376-381 ❞

「摘要信息:」

❝以55岁且吸烟剂量30包/年人群的5年绝对发病风险为参考届值,在吸烟者和非吸烟者中分别计算不同遗传风险人群5年肺癌绝对发病风险随年龄和吸烟剂量的变化趋势,并绘制5年绝对发病风险分布图,从而判断不同遗传风险人群达到参考界值时的理论年龄或吸烟剂量。根据上述结果给出不同遗传风险人群参加肺癌筛查起始年龄的具体建议。结果 CKB队列中55岁吸烟者,当吸烟量为30包/年时,5年内发生肺癌的绝对风险为0.67%。在吸烟者中,随着遗传风险增加,其5年绝对发病风险呈不断上升趋势,对于高遗传风险人群应降低筛查起始年龄,遗传风险最高的1%人群建议从50岁开始进行筛查;若保持筛查起始年龄55岁不变,则应在高遗传风险人群中降低吸烟剂量标准;不管累积吸烟剂量为多少,遗传风险最高的1%人群都应纳入肺癌筛查。在非吸烟者中,高遗传风险人群同样具备筛查价值,建议遗传风险最高的1%人群从62岁起进行肺癌筛查,而对于遗传风险最低的5%人群,当年龄达到74岁时才可达到参考届值。结论 对于不同遗传风险的个体,可采用个体化的肺癌筛查方案,对于高遗传风险的吸烟者可减小肺癌筛查起始年龄或吸烟剂量,而我国高遗传风险的非吸烟者同样具备筛查价值。 ❞

「我的理解:」

我们知道肺癌和吸烟有关系,与吸烟量有关系,与年龄有关系,与遗传也有关系。

用模型语言来说:

  • 年龄,影响因素,放到模型中
  • 吸烟量,影响因素,放到模型中
  • 遗传,GWAS分析得到的位点,不同分型,癌症概率不一样,放到模型中

综合起来,就是当你的年龄是多少,吸烟量是多少,基因分型的是什么,最后预测你5年患癌症的概率是多少,概率高的话就是高危人群,建议戒烟或者降低吸烟量,定期体检……

动植物中,我们用GWAS得到的位点,进行分子标记辅助选择(MAS),用全基因组的标记进行基因组选择(GS),而在人类上用多基因风险评分(PRS)进行预测,很相似。

「为何要用PRS」

PRS,全称polygenic risk score,多基因风险评分。因为单个基因位点效应较弱,所以需要将多个位点合并进行预测,PRS就是综合考虑多个基因位点进行预测常用的方法。

「本系列计划达到的目标:」

  • 多基因风险评分,原理理解,学会操作
  • 孟德尔随机化分析,原理理解,学会操作
  • 分享相关软件教程
  • 分享相关代码和数据
  • 根据文献数据,重演分析流程和结果

「最终目标:学会掌握PRS和MR!希望大家一起学习,共同掌握。」