zl程序教程

您现在的位置是:首页 >  其他

当前栏目

Nature Communications:主要精神和神经退行性疾病的共同机制

2023-02-19 12:21:01 时间

摘要

几种常见的精神病和神经退行性疾病具有共同的流行病学风险; 然而,它们是否具有共同的病理生理学尚不清楚,是科研工作者的研究重点。作者使用25个全基因组关联研究 (GWAS)结果和LD得分回归,发现精神疾病和神经退行性疾病之间存在八种显著的遗传相关性。作者将GWAS结果与人脑转录组 (n = 888) 和蛋白质组 (n = 722) 进行整合,以鉴定顺式和跨蛋白以及与每种疾病中的多效性或因果(致病)作用一致的蛋白质,为简洁起见称为因果蛋白(致病蛋白),并在每个疾病组中都发现了许多独特且共享的因果蛋白。值得注意的是,神经退行性疾病病因蛋白的30% (42个中的13个) 与精神疾病共享。此外,作者发现精神和神经退行性因果蛋白之间的蛋白质-蛋白质相互作用比偶然预期的多2.6倍。发现的结果共同表明,这些精神和神经退行性疾病具有共同的遗传和分子病理生理学,这对早期治疗和治疗发展具有重要影响。

介绍

有几条证据将通常在成年早期或成年中期表现的精神疾病与晚年神经退行性疾病联系起来。这些精神疾病包括重性抑郁症,双相情感障碍,精神分裂症,焦虑症,创伤后应激障碍,有问题的酒精使用,神经退行性疾病包括阿尔茨海默病,路易体痴呆,帕金森氏病,肌萎缩性侧索硬化症和额颞叶痴呆。首先,经历这些精神疾病之一的个体在后期患痴呆症或神经退行性疾病的风险高达四倍。第二,大约65% 的神经退行性疾病患者在疾病过程中经历了使人衰弱的精神症状。第三,最近的证据表明精神分裂症和帕金森氏病之间存在共同的遗传风险。

鉴于这些联系,作者假设这些精神和神经退行性疾病之间存在共同的遗传和分子基础。对这些精神和神经退行性疾病之间共享的机制的见解可以促进发展针对精神和神经退行性疾病以及在神经退行性疾病过程中出现的精神症状的新颖,有效的治疗方法。此外,由于许多神经退行性疾病在症状之前有十年或更长时间的潜伏期,因此针对成年早期或中期精神疾病的治疗可能会减轻以后生活中痴呆和神经变性的风险。鉴于目前迫切需要对精神病和神经退行性疾病进行更有效的治疗,针对其共同机制的疗法具有深远的意义。

脑蛋白是这些脑疾病药物发现的有希望的靶标。蛋白质通常是稳定的,通常是细胞过程或生物学功能的最终执行者,并且构成了当前药物治疗的绝大多数目标。此外,异常的蛋白质积累,构象和相互作用是神经退行性疾病的共同特征。直接研究脑蛋白而不是转录本可以避免脑mRNA水平通常与脑蛋白丰度没有很好的相关性的并发症,这可能是由于转录后,翻译和翻译后调控。最后,在同一生物学途径中起作用的蛋白质通常会发生物理相互作用,这可以用来推断共同的病理生理学。

作者使用两种方法来检验某些精神病和神经退行性疾病具有共同的遗传和分子基础的假设。首先用LD评分回归25和最新的全基因组关联研究(GWAS) 结果在上述精神和神经退行性疾病之间进行了大规模的成对遗传相关性。作者还纳入了大脑结构变化,以帮助评估这些相关性,因为某些区域的大脑结构变化可能导致疾病或疾病 (例如海马和阿尔茨海默氏病)。这些遗传相关性代表了全基因组水平的相关性。其次,作者试图通过使用多种互补方法如蛋白质组范围关联研究 (PWAS),孟德尔随机化和遗传共定位分析,将每个GWAS结果与最大的一组深度轮廓人脑蛋白质组 (n = 722) 相结合,通过它们对脑蛋白质丰度的影响来确定赋予疾病风险的特定基因。以逐步方式应用的三种分析方法能够鉴定与多效性一致或在疾病中具有因果作用的蛋白质 (为简化起见,后文被称为与因果作用或因果蛋白一致)。对于与所研究的精神病和神经退行性疾病的发病机理有关的蛋白质,确定了共享和独特的因果蛋白,并检查了物理蛋白质-蛋白质相互作用富集的证据,这对于参与相同分子或生物学途径的蛋白质是可以预期的。然后,作者应用相同的分析流程分析了888个人脑转录组,以提供另一层证据。此研究结果发现涉及几种不同的和共享的因果脑蛋白,并阐明了这些神经系统和神经退化疾病之间潜在的共享机制,为精准医学和治疗发展铺平了道路。

结果

研究设计

作者利用GWAS的最新发现来研究8种精神疾病(重性抑郁障碍,双相障碍,精神分裂症,焦虑,创伤后应激障碍,酒精中毒、神经质和失眠),五种神经退行性疾病疾病(阿尔茨海默病、路易体痴呆、额颞叶痴呆,肌萎缩侧索硬化症和帕金森病)以及11种脑结构内表型,白质高信号,皮质海马的厚度,皮质表面积和体积,杏仁核,伏隔核,尾状核,壳核,球苍白球、丘脑和脑干,图1,表1)。作者还纳入了2例患者GWAS的AD,因为它们在研究设计上不同。一个集中只有临床诊断的AD,而另一个也包括实质性的英国生物样本库使用家庭的个体比例痴呆病史作为替代病例或对照。利用这些GWAS结果,作者首先通过LD评分检查了这些之间的成对遗传相关性脑特征回归来确定是否存在这些精神疾病和神经退行性疾病之间的共同遗传基础。接下来,作者使用PWAS、基于汇总数据的孟德尔随机化的组合(SMR)和共定位分析整合了722个与每个性状的因果作用一致深度人脑蛋白质组(表S1)及其各GWAS的结果鉴定了顺式和反式调节的脑蛋白。对于脑蛋白质有证据表明两者之间存在因果关系我们根据区域和细胞类型检测了大脑的表达并测试了蛋白质-蛋白质相互作用(PPI)的证据。最后,作者从这些共同的致病蛋白中收集了生物过程PPI网络来识别这些精神病和神经退行性疾病的共同机制。

精神疾病,神经退行性疾病, 和大脑结构组的遗传相关性

为了估计精神病、神经退行性变和脑结构表型组内和组间性状之间的遗传相关性,作者使用欧洲血统受试者的GWAS汇总统计量(图2A,表S2)进行了LD评分回归。根据设计,LD评分回归方法对GWAS中的样本重叠具有稳健性,并最大限度地减少了LD结构差异的潜在偏倚。作者发现精神疾病之间存在许多显著的正遗传相关性,这与之前的研究一致,大脑结构之间也与之前的研究一致。值得注意的是,我们发现AD、PD和LBD之间分别存在正的成对遗传相关性,这表明这三种常见的神经退行性疾病具有共同的遗传易感性(FDR p〈0.05,图2A,表S2)。

在神经退行性疾病和脑体积表型(海马、壳核、脑干、皮质表面积)之间,作者发现了显著遗传相关性的证据(FDR p〈0.05,图2A,表S2)。在精神病和大脑结构表型(皮质表面积、皮质厚度和WMH)之间,也发现了显著的遗传相关性(FDR p〈0.05,图2A,表S2)。值得注意的是,作者发现神经退行性疾病和精神病特征之间存在正遗传相关--AD分别与神经质、MDD、BD、PTSD、酗酒和失眠相关; LBD与焦虑症状之间的关系;以及ALS和焦虑症状之间的差异(FDR p〈0.05,图2B,表S2)。这些新的发现与精神疾病与神经退行性疾病有共同的遗传基础这一假设相一致。

顺式调节蛋白与24种脑特征的因果作用一致

为了进一步扩充精神病和神经退行性疾病之间共有遗传基础的证据,作者试图通过对脑蛋白丰度的影响来鉴定赋予疾病风险的特定基因。为此,作者使用722个参考人脑蛋白质组对每种脑特征进行PWAS,以鉴定与每种特征相关的顺式调节蛋白。使用串联质谱法对大脑蛋白质组进行了分析,主要来自额叶皮质(表S1)。在整合之前分别在每个蛋白质组数据集中进行质量控制、归一化、去除临床特征和技术因素的影响,并使用Z尺度标准化蛋白质丰度。然后,作者将这些蛋白质组数据集合并成一个组合蛋白质组图谱,并进行替代变量分析。在应用与GWAS结果的整合之前,我们对识别出的隐藏混杂因素的影响进行了回归。经过质量控制和标准化后,9363个蛋白质保留在组合蛋白质组学图谱中,其中2909个具有显著的基于SNP的遗传性,可纳入PWAS。使用基因周围500 Kb窗口内的变体估计遗传变体对这2909种蛋白质中每一种蛋白质丰度的影响。平均而言,11.8%的测量蛋白质丰度的方差(中位数:6.9%,范围[0.04-68.1%])归因于顺式遗传变异(表S3)。随后,使用FUSION 对每个性状进行PWAS,其整合了对蛋白质丰度的遗传效应和对给定性状的遗传效应。FDR调整后PWAS中每种性状的重要蛋白列于表S4。我们总共进行了25次独立的PWAS,共鉴定了839个与24种大脑特征相关的顺式调节蛋白。

接下来,作者使用孟德尔随机化法(SMR),按照SMR处理方法,测试了在每个PWAS中鉴定的顺式调节蛋白是否介导了遗传变异和疾病之间的关联。由于遗传变异、蛋白质和疾病之间的关联可能是由于连锁不平衡、多效性或因果关系,我们还使用依赖性工具异质性检验(HEIDI)27检验了连锁不平衡与多效性或因果关系的概率,并仅保留了多效性或因果关系的关联。此外,作者还使用了一种互补的贝叶斯方法,COLOC来检查疾病相关变异和蛋白质丰度相关变异的共定位。在考虑了PWAS、SMR/HEIDI和COLOC的结果后,发现了651个顺式调节蛋白,这些蛋白与24个性状中的一个或多个性状的因果关系或多效性一致,并在表1中列出了每种性状的这些蛋白的数量,在表S4中列出了每种性状的特异性蛋白。为了简单起见,我们将顺式调节的蛋白质与因果性或多效性一致称为顺式因果蛋白质。

反式调节蛋白与24种脑特征的因果作用一致

除了顺式调节蛋白,作者还试图鉴定与这些大脑特征中的每一个的因果作用一致的反式调节蛋白。作者首先使用722个参考人脑蛋白质组和相应的全基因组基因型,在25 GWAS确定的全基因组显著SNPs中进行了trans-pQTL分析。在p〈5× 10−8处,与蛋白质丰度相关的SNPs被宣布为反式pQTL,并且位于蛋白质编码基因的500 kb窗口之外。我们在这些GWAS显著SNPs中发现了13个蛋白质的trans-pQTLs。随后,作者使用trans-SMR/HEIDI 流程进行孟德尔随机化,以鉴定通过多效性或因果关系介导GWAS显著SNP与疾病之间关联的反式蛋白。作者鉴定了12个反式调节蛋白,这些蛋白与这些大脑特征中的几个的因果关系或多效性一致(表1,表S4)。为简单起见,作者将与因果性或多效性一致的反式调节蛋白质称为反式因果蛋白质。

特征组内共有的因果蛋白

在阐明了每种大脑特征的顺式和反式因果蛋白之后,作者接下来分别鉴定了精神病、神经退行性变和大脑结构类别中特征之间相互因果的蛋白质。由于不同性状具有不同数量的已鉴定致病蛋白质,作者检测了每种性状的致病蛋白质在一个群体中所占的百分比。总的来说,作者观察到每个组内特征对之间有相当大比例的共享因果蛋白质--精神病组平均共享45%(范围[31 - 75%]),神经退行性变组共享21%(范围[0 - 50%]),脑结构组共享30%(30% [0%-50%],图3A和4A;表1)。表S5列出了性状对之间共有的单个蛋白质。在精神病组中,许多致病蛋白质在三种或三种以上的性状中是共有的(图3B)。具体而言,14种蛋白质在三种精神性状中共享,三种蛋白质(GNL3、RASGRP1、RGS6)在四种精神性状中共享,两种蛋白质(CTNND1、CNNM2)在五种精神性状中共享(图3B,表S5)。在神经退行性变组中,AD和PD之间共享两种蛋白(VKORC1和STX1B),基于临床诊断和痴呆家族史,AD和临床诊断之间共享另外两种蛋白(QPCT和CD2AP)(图3C,表S5)。在脑形态学组中,MAPT在4个性状中相互因果,ABCG2在3个性状中相互因果(图4B,表S5)。总之,这些发现强调了精神病、神经退行性变和脑结构特征组内的共同遗传倾向。

图1 实验设计总图

表1 通过PWAS、SMR/HEIDI和COLOC确定的每种大脑特征的来源GWAS和致病蛋白数量总结(每种性状的样本量(N)是分析中使用的对GWAS结果有贡献的样本数量,由于数据访问限制或限于欧洲血统的样本,可能小于GWAS原始出版物中报告的样本。GWAS显著性SNP定义为p值〈5 × 10−8的SNP。如果一个蛋白质与另一个性状组中的任何其他性状也有因果关系,则认为该蛋白质与该性状组共有。由于不同性状具有不同数量的已鉴定致病蛋白,作者检测了每种性状的致病蛋白在一个性状组内或两个性状组之间共享的百分比。这些信息也在如图3A和4A所示〉)

特征组间共有的因果蛋白

在精神病组和神经退行性疾病组之间,作者发现了13种共有的因果蛋白,占神经退行性疾病共44种已鉴定致病蛋白的30%(图3D,表S5)。这一惊人的共享因果蛋白百分比支持了精神病和神经退行性疾病组之间共享遗传和分子基础的假设。

在这13个共有的致病蛋白质中,8个在一对性状(精神病和神经退行性疾病)之间共有,3个在三个性状(精神病、神经退行性疾病和另一种精神病或神经退行性疾病)之间共有,2个在四个性状(多种精神病和神经退行性疾病;图3D)。此外,作者发现精神病和神经退行性疾病之间的遗传相关程度和共有的偶然蛋白质的百分比之间呈正相关(斯皮尔曼rho =0.39; p=0.01;图S1)。在神经退行性病变组和脑结构组之间,存在4种共有的因果蛋白,其中MAPT在PD、壳核体积、脑干体积、皮质厚度和皮质表面积之间共有(图4C,表S5)。在精神病和大脑结构类别之间,有29个共同的因果蛋白,其中MAPT在三种精神病特征和四种大脑结构之间共享(图4D)。值得注意的是,AKT 3和MAPT在属于精神病、神经退行性变和脑结构这三个组的多个特征中是共有的(图4 E)。总之,这些共有的因果蛋白强调了精神病和神经退行性疾病之间共有的遗传易感性。

图2 大脑结构、精神病和神经退行性疾病之间的遗传相关性(A 使用LD评分回归分析24个脑性状之间的成对遗传相关性 B基于LD评分回归的精神病和神经退行性特征之间的遗传相关性颜色表示相关性的大小和方向。彩色正方形的大小反映了p值的大小。星号表示FDR p值:* FDR p〈0.05;** FDR p〈0.01,*** FDR p〈0.001。精确p值见表S2)

图3 精神病和神经退行性疾病组内和组间共有的因果蛋白(A 精神病和神经退行性疾病组内和组间共有的因果蛋白数量和百分比 B 精神病组中共有的因果蛋白C 神经退行性疾病组中共有的因果蛋白 D 在精神病和神经退行性疾病组之间共有的因果蛋白。焦虑、创伤后应激障碍和失眠没有被列出,因为它们与神经退行性疾病没有共同的因果蛋白)

图4 因果蛋白在脑结构特征组内共享,并分别在脑结构组、精神病组和神经退行性病变组间共享(A在脑结构组内以及在脑结构组与精神病和神经退行性病变组之间,分别存在因果蛋白的数量和百分比 B 脑结构组中共有的因果蛋白 C 脑结构组与神经退行性疾病组间共有的因果蛋白 D 脑结构组和精神疾病特征组间共有的因果蛋白 E 三组间共有的因果蛋白)

因果蛋白的脑区和细胞型表达

作者检测了13种因果蛋白在精神病和神经退行性疾病中的表达,这些蛋白质在与这些疾病相关的不同脑区域中,包括杏仁核、伏隔核、前扣带回、额叶皮质、海马、蓝斑、黑质和颞叶。为了比较它们在不同脑区的表达,作者检查了来自AllenBrainAtlas 48的Z评分标准化人脑表达数据(图5A,B;表S6)。发现每个基因的表达水平在这些脑区域中是不同的,并且不同基因的相对基因表达模式也不同。例如,HSDL 1在蓝斑中的表达比在其他脑区域中高得多,而AKT 3在蓝斑中的表达比在其他脑区域中低得多。这些观察结果可能有助于为随访机制研究的设计提供信息。作者还使用小鼠同侧皮质和海马结构的单细胞RNA测序数据,检测了GABA能、谷氨酸能和非神经元细胞中这13种共有致病蛋白的表达。发现这13种蛋白质在脑中具有不同的解剖学表达模式(图S2)。为了了解不同脑细胞类型的基因活性,我们使用认知正常供体dPFC的人类单细胞RNA测序数据,检查了这651种致病蛋白质的脑细胞类型特异性表达。在13种共有致病蛋白中,10种蛋白在一种脑细胞类型中的表达高于其他脑细胞类型中的其余蛋白(图5C,表S7)。值得注意的是,其中4种蛋白在兴奋性神经元中高度表达(CCDC 6、DOC 2A、SPATA 2、STX 1B),2种蛋白在抑制性神经元中高度表达(ADK、HSDL 1),2种蛋白在少突胶质细胞中高度表达(ADAM 10、STXBP 3)(图5C,表S7)。这24种精神病、神经退行性病变和脑结构性状的所有不同和共有致病蛋白的细胞类型表达见表S7。

精神病和神经退行性疾病组因果蛋白之间的蛋白-蛋白相互作用

此前,作者已讨论了在精神疾病和神经退行性疾病中的因果蛋白,作为共同易感性的证据。另一种可能出现共享机制的方式是通过因果蛋白之间的蛋白质-蛋白质相互作用(PPI)。假设精神病和神经退行性疾病因果蛋白质之间的PPI水平高于偶然情况。为了验证这一点,作者使用BioGRID 51中的物理PPI数据确定了精神病因果蛋白(407个总蛋白质)和神经退行性疾病因果蛋白(44个总蛋白质)之间的PPI数量。BioGRID中的物理PPI数据是根据同行评审的生物医学文献中的主要实验证据筛选的。在99种精神病和30种神经退行性疾病致病蛋白之间发现了120种PPI的证据(其中11种在两组之间共享)。与原假设一致,这反映了因果性精神病和因果性神经变性蛋白质之间的物理PPI比单独偶然预期的高2. 6倍(bootstrap = 0. 003;图6;表S8)。这些PPI属于118种精神病和神经退行性疾病因果蛋白。这118个共有的相互作用的致病蛋白质可能为了解精神病和神经退行性疾病组之间共有的机制提供了一个窗口。在这118个共有的相互作用的致病蛋白中,有几个值得注意的蛋白与其他致病蛋白有广泛的相互作用。例如,PDHA 1(一种PD致病蛋白)与15种精神病致病蛋白物理相互作用; MAPT(另一种PD致病蛋白)与11种精神病致病蛋白物理相互作用; LACTB(AD致病蛋白)与10种精神病致病蛋白相互作用; SCFD 1(ALS致病蛋白)与9种精神病致病蛋白相互作用; CCDC 6和STX 6(AD致病蛋白)分别与7种精神病致病蛋白相互作用(图6A,B;表S8)。这些相互作用提供了重要的证据支持精神病和神经退行性疾病组之间共享分子机制的假设。

精神疾病和神经退行性疾病的共同生物学过程

为了深入了解共有的分子过程,作者使用Gene Ontology、KEGG、Wiki pathways、CORUM和REACTOME数据库分别对13个共有的致病蛋白和118个共有的和相互作用的致病蛋白进行了基因集富集分析。精神病组和神经退行性病变组共有的13种致病蛋白质富集于钙离子调节的胞吐作用和蛋白质在突触的定位(FDR p〈0.05,表S9,a)。118个相互作用的精神病和神经退行性疾病致病蛋白质在几个过程中被富集-神经递质分泌、突触囊泡介导的转运、突触囊泡再循环、SNAP受体活性、髓样白细胞活化和线粒体过程等(FDR p〈0.05,图7A;表S9,b)。为了追踪这些发现,作者又分别使用专门人脑突触和线粒体数据库检查了这118种相互作用致病蛋白质中PPI和基因组富集我们使用了精心设计的人类突触蛋白质组数据库52,其中包括7907个突触前、突触和突触后蛋白质。在这118种相互作用的因果蛋白中,发现了102种突触蛋白,这是突触蛋白的2.2倍富集(p〈9.5 × 10−27)。此外,这102个突触蛋白质富集了与118个蛋白质相似的生物学过程(FDR p〈0.05,表S9,c)。为了进一步研究线粒体过程的富集,作者使用MitoCarta3.053,一个包含1137个人类线粒体相关基因的数据库。在118种相互作用的致病蛋白中鉴定了24种线粒体蛋白,是线粒体蛋白的3.7倍(p〈2.3 × 10−8)。基因组富集分析发现,这24个线粒体蛋白质在线粒体基质和线粒体内膜等亚区室中分布相似(FDR p〈0.05;图7 B;表S9,d)。然后,作者查询了高密度的人类线粒体邻近相互作用网络54,发现了这24种线粒体蛋白中的66种蛋白的相互作用组(图S3)。

  综上,使用一般和专门的突触和线粒体蛋白质数据库的结果暗示突触传递和免疫功能是精神病和神经退行性疾病之间共享机制的重要过程。

图5 13种因果蛋白在不同脑区和细胞类型中的表达在精神病和神经退行性疾病之间共享(A 13种同时在精神病和神经退行性疾病组中相互存在因果关系的蛋白质列表B 基于Allen脑图谱中人脑基因表达数据,13种共有因果蛋白在不同脑区的表达。较高的Z评分(红色)表示较高的表达,较低的Z评分(蓝色)表示该脑区域较低的表达C 基于人类单细胞RNA测序数据,13种共有因果蛋白在不同细胞类型中的表达。用Wilcoxon秩和检验确定一种特定细胞类型的基因表达是否不同于所有其他四种细胞类型的基因表达。显著性差异定义为Bonferroni校正的p值〈0.05(对所有17,775个基因进行校正)。13个基因中只有10个在特定的细胞类型中高度表达,并在此描述。其他3个基因在不同细胞类型中表达相似。)

图6 精神病因果蛋白和神经退行性疾病因果蛋白之间的物理蛋白-蛋白相互作用(PPI)(A精神病因果蛋白(黄色)和神经退行性疾病因果蛋白(粉红色)之间的PPI。此处仅考虑了精神病和神经退行性疾病因果蛋白之间的物理PPI(而不是精神病和另一种精神病因果蛋白之间或神经退行性疾病和另一种神经退行性疾病因果蛋白之间)。总共有118种精神病和神经退行性疾病的因果蛋白相互之间存在物理PPI,完整结果见表S8。B 精神病因果蛋白和神经变性因果蛋白之间的PPI。A中呈现的信息相同,但每种大脑特征都用不同的颜色描述。完整结果见表S8)

图7 118种共有和相互作用的精神病和神经退行性疾病因果蛋白的基因组富集分析(GSEA)(A 这118个共有的和相互作用的致病蛋白富集于生物过程中。完整结果见表S9,b。B 24个线粒体蛋白质的生物学功能得到了富集。这24种线粒体蛋白质是118种共有和相互作用的因果蛋白质的子集。)

脑mRNA水平的共享机制

为了追踪大脑蛋白质的发现,作者应用了相同的分析方法,使用了888个主要来自额叶皮质的人脑转录组。为简单起见,将与因果作用或多效性一致的mRNA称为因果mRNA。作者鉴定了24种大脑特征中每一种的独特和共享的顺式和反式因果mRNA(表2; S10-S12)中的一个或多个。其中精神病性症状有615个因果性mRNA,神经退行性疾病有64个因果性mRNA。与之前在蛋白质水平上的发现一致,在每一组内以及在精神病、神经退行性变和脑结构特征的组之间有共同的因果性mRNA(表2;表S12)。具体而言,在精神病和神经退行性疾病之间有24种共有的因果mRNA,占鉴定的总神经退行性疾病因果mRNA的37.5%(表S13)。与在蛋白质水平的发现相似,在145个精神病和神经退行性疾病因果mRNA之间有171个物理PPI(表S14)。这是PPI的2.0倍(p =0.008)。基因组富集分析发现,这145个共有的和相互作用的因果mRNA被富集用于线粒体的组织、运输和分裂;基因表达表观遗传调控;基因沉默;染色质修饰酶;组蛋白甲基转移酶复合物; RNA结合; RNA代谢;蛋白质靶向的调节;和蛋白质泛素化(表S15)。PWAS包括2909个可遗传蛋白质,TWAS包括6735个可遗传mRNA,其中1726个基因是这些蛋白质和mRNA之间的共同基因。平均39.6%的致病mRNA也是致病蛋白质,32.3%的致病蛋白质也是致病mRNA(表S16)。ADAM 10和CCDC 6在mRNA和蛋白水平上是精神病和神经退行性疾病的共同致病基因。

表2 通过TWAS、SMR/HEIDI和COLOC识别的源GWAS和因果mRNA数量总结(每个性状的样本量(N)是指我们分析中使用的对GWAS结果有贡献的样本数量,由于数据访问的限制或限于欧洲血统的样本,该样本量可能小于GWAS原始出版物中报告的样本量。GWAS显著SNP被定义为p值〈5 × 10−8的SNP。如果AmRNA与一个性状组中的其他性状也有因果关系,则认为AmRNA在该性状组中共享。由于不同的性状具有不同数量的已鉴定的因果mRNA,我们检查了每种性状的因果mRNA在一个性状组内或两个性状组之间共享的百分比〉)

讨论

在本研究中,作者提出了强有力的新证据,证明通常出现在成年早期或中年得精神疾病与通常出现在老年得神经退行性疾病之间存在共同得遗传和分子基础.精神病和神经退行性疾病与13种共有因果蛋白之间的显著遗传相关性证明了共有的遗传易感性。有更多的证据表明,致病性精神病和致病性神经退行性疾病蛋白质之间的物理PPI几乎高出3倍,这暗示了两组疾病中涉及的基因和分子过程的特定网络。此外,作者发现SNARE复合物、囊泡转运、突触传递、免疫功能和线粒体过程参与了这些共同的机制,并确定了参与这些生物学过程的脑蛋白,以供进一步的机制研究。

这种共有的遗传和分子过程对这些常见脑疾病的管理和治疗发展具有深远的影响。就背景而言,这些精神疾病每年影响约30%的人,年龄在早期或中年(年龄〈65岁),而神经退行性疾病影响全球约4400万人,大多数在晚年,没有有效的治疗方法来减缓或阻止潜在的神经退行性疾病18。此外,约65%的患有神经变性疾病的个体经历精神病症状(也称为神经精神症状),这些症状与更快的认知下降、更大的功能障碍、更高的护理者负担和更早的机构化相关,但是对于这些神经精神症状还没有安全有效的治疗方法。这些精神病和神经退行性疾病组都是全球残疾的主要原因,迫切需要对这些脑部疾病进行有效治疗。鉴于共有的分子基础,关注共有病理生理学的治疗可能不仅能够治疗早/中年精神疾病,还能够治疗晚期神经退行性疾病的常见神经精神症状,以及减轻晚期神经退行性疾病和痴呆风险。

这项研究的另一个值得注意的发现是鉴定了651种与24种大脑特征的因果作用一致的大脑蛋白质。在651种脑蛋白质中,394种是精神疾病所特有的,31种是神经退行性疾病所特有的,13种是精神疾病和神经退行性疾病所共有的。与本研究和先前研究中鉴定的这些脑部疾病的致病转录物一起,这些致病蛋白质为治疗这些常见和使人衰弱的脑部疾病的治疗开发提供了机制性见解和有前景的靶点。

虽然突触传递在这些精神障碍的病理生理学中的作用的证据仍在出现,但突触传递和SNARE复合体在神经退行性疾病的病理生理学中的作用更确定。此外,突触传递由神经元中的线粒体调节,线粒体产生ATP来为神经传递过程提供动力并调节突触前钙水平,而突触前钙水平又决定神经递质的释放。因此,线粒体对于维持突触传递和功能至关重要。值得注意的是,作者发现线粒体过程与精神病和神经退行性疾病的共同病理生理学有关。虽然这是一种新现象,但与线粒体功能障碍发生在神经退行性疾病进展早期并持续至疾病晚期的观察结果一致,因为共有机制更可能是早期作用,因为精神疾病的发病年龄为成年早期或中年,而神经退行性疾病表现为老年。

前人已经发现脑中相同基因的mRNA和蛋白质表达水平具有适度的相关性。作者团队发现32%的致病蛋白质也是致病mRNA,与现存文献一致。小胶质细胞在AD的发病机制中起重要作用。例如,从AD GWAS推断的400个基因中约有5%显示小胶质细胞高表达。注意,与大脑组织相比, 10%的AD致病蛋白在小胶质细胞中高表达- CTSH(高8倍)和PLXDC 2(高53倍)75。此外,TREM 2是本次鉴定的AD病因mRNA之一,并且它是选择性地在小胶质细胞中表达的先天免疫受体(比大部分脑组织高56倍)。

在精神病和神经退行性疾病之间共有的13种致病蛋白质中(图3D),有5种已经在一种或多种脑疾病的人类参与者或小鼠模型中进行了研究。例如,ADAM10的突变导致转基因小鼠的AD病理学,精神分裂症患者与对照组之间ADAM10的mRNA表达水平存在差异。在另一个例子中,AD患者与对照组73和精神分裂症患者与对照组78脑中DOC2A mRNA表达存在差异,这都支持了作者的发现。此外,海马中CCDC6的mRNA表达水平在AD患者和对照组之间有差异,但尚未在双相情感障碍或精神分裂症中进行研究。此外,脑中MTSS1L的mRNA水平在AD患者与对照组之间差异表达,但尚未在双相情感障碍中进行研究。最后,脑中STX1B mRNA水平在AD患者与对照组之间有差异表达,但尚未在神经质或帕金森病中进行研究。这些已发表的结果为此次的发现提供了证据,同时也强调了所鉴定的共有致病蛋白是模型系统中机制研究的新靶点,以促进我们对精神病和神经退行性疾病之间共有机制的理解。

我们的发现应该在研究局限性的背景下考虑。例如,检测LBD和FTD的因果脑蛋白的能力受到其基础GWAS能力的限制。因此,MAPT被发现是多种精神疾病和帕金森病的致病蛋白,但不是AD的致病蛋白,AD通常与MAPT的异常积累有关。我们注意到MAPT在临床AD的PWAS中仅名义上有意义(p = 0.027,FDR=0.52),可能是由于功率限制,未来更大的GWAS可能有助于解决这个问题。另外,由于缺乏人脑单细胞蛋白质组学数据,我们不能准确地解释 PWAS中细胞类型异质性。此外,通过722个人脑深部蛋白质组,作者鉴定出2909个PWAS和SMR的遗传蛋白。随着人脑蛋白质组数量的增加,后续有可能鉴定出更多可遗传的脑蛋白质。尽管有这样的限制,作者在这里展示了我们所知的最大和最深的人脑蛋白质组。最后,GWAS和人脑蛋白质组来自欧洲血统的参与者,这可能限制了此发现在其他种族个体中的普适性。

本研究有几个优势。首先,作者使用了最大的一组人脑深部蛋白质组,以最大限度地增加PWAS中可遗传蛋白质的数量,从而能够检测更多的蛋白质。第二,包含了24种脑特征,包括在神经退行性疾病中经常作为中间表型的结构性脑特征。第三,鉴定了顺式和反式调节的致病蛋白。第四,检查了脑蛋白质和mRNA。最后,这里鉴定的致病蛋白对于治疗开发是非常有希望的,因为来自GWAS和孟德尔随机化的致病基因已经显示出使治疗靶点获得药物批准作为人类疾病治疗的几率加倍。

综上,本研究证明了主要的精神和神经退行性疾病具有共同的遗传易感性和病理生理学,并鉴定了13个共同的致病蛋白,118个相互作用的致病蛋白,以及突触传递,免疫功能和线粒体过程在共同发病机制中的中心作用。这两组常见脑疾病之间的基因和分子联系对于疾病管理和治疗开发具有重要意义,涉及精确医学、早期治疗和预防神经变性和痴呆风险。

方法

为了估计成对遗传相关性,作者使用来自欧洲血统参与者的GWAS汇总关联统计量进行了LD评分回归。LD评分回归方法不会因GWAS中的样本重叠而产生偏倚,并通过将分析限制在1000个欧洲基因组数据中插补良好的SNP,将LD结构的影响降至最低,同时去除了具有极大效应量(X12〉80)的SNP。错误发现率(FDR)用于校正多次测试。

作者使用FUSION流水线途径,使用GWAS结果、参考蛋白质组学和遗传学数据集进行25次独立PWAS。首先,将基因型数据限制为FUSION软件提供的LD参考组中的SNP,包括来自1000个基因组EUR样本的1,190,321个SNP,以最大限度地减少连锁不平衡对分析的影响。接下来,估计每种蛋白质的基于SNP的遗传力。具有基于SNP的遗传率p〈0.01的蛋白质被宣布为可遗传的。在去除HLA区域的蛋白质后,发现了2909个可遗传的蛋白质(表S3)。接下来,对于每一个可遗传的蛋白质,作者估计了基因500Kb窗口内的一组SNPs对其蛋白质丰度的影响,也称为蛋白质“重量”。作者应用了BLUP、LASSO、弹性网络和BSLMM预测模型,并保留了最佳预测模型的权重。随后,将脑蛋白质重量与25个GWAS汇总统计量中的每一个进行整合,以执行25个独立的PWAS。每个基因的PWAS Z值代表蛋白质和SNP对性状的联合效应。PWAS鉴定了与该性状相关的顺式调节蛋白。将FDR校正p值〈0.05的蛋白定义为显著蛋白。

接下来,在上述PWAS中鉴定的重要顺式调节蛋白中,作者进行了基于汇总数据的孟德尔随机化(SMR),以测试脑蛋白是否介导基因和性状之间的关联。为此,作者首先通过使用线性回归测试每个基因500 Kb窗口内的每个SNP与蛋白质丰度的关联来鉴定蛋白质数量性状基因座(pQTL)。使用PLINK 调节10个遗传主成分(使用EIGENSTRAT计算)进行回归建模。然后,在PWAS显著蛋白质中,作者将SMR应用于cis-pQTL和GWAS汇总统计量,以检验它们是否介导了基因和性状之间的关联。由于这种中介作用可能来自因果关系、多效性或连锁不平衡,因此使用HEIDI 来检测并消除可能由于连锁不平衡引起的关联(即,HEIDI p〈0.05)。作者使用贝叶斯共定位方法补充SMR/HEIDI方法,用边缘关联统计量进行COLOC ,以估计蛋白质和性状共享或不共享遗传变异的后验概率。

作者在从25个GWAS中鉴定的独立的全基因组显著SNPs中进行了trans-pQTL分析。首先,从常染色体中选择全基因组显著的SNP(每个GWAS的p值〈5 × 10−8),并使用PLINK 在250 kb窗口内过滤为独立的SNP(r2〈0:5)。然后用PLINK中执行的线性回归检查了这些SNP中的每一个和每种脑蛋白丰度之间的关联,调整了10个遗传PC。与p值〈5 × 10−8的蛋白质相关且在蛋白质的500 kb窗口之外的SNP被称为反式pQTL。接下来使用trans-SMR流水线途径测试了由trans-pQTLs调节的蛋白质是否介导GWAS SNPs和性状之间的关联。为此,作者首先对转pQTL的500 kb窗口内的所有SNPs进行pQTL分析。随后通过在SMR中指定“-trans”和“-trans-wind 500”选项,将trans-SMR 应用于trans-pQTLs,这将检测限制在目标SNPs和至少相距5 Mb的基因,并在目标pQTLSNP周围定义了500 kb的窗口大小,用于选择SMR和HEIDI检测的SNPs。作者使用Bonferroni校正阈值(0.05 /显著pQTL数量)来宣布显著的trans-SMR结果。

顺式调节蛋白若满足以下A到C标准,则被认为符合因果关系或基因多效性特征:(a)该蛋白FDR p<0.05时与PWAS中的性状相关; (b)在统计学上,该蛋白质在SMR检验中显示出介导SNPs与性状之间关联的证据,p〈0.05; (c) SMR中的关联不是由于连锁不平衡,如HEIDI所反映的p〉0.05;或同时满足以下D和E标准:(d)该蛋白与PWAS中的性状相关,FDR为p〈0.05;(e)蛋白质和性状具有共享遗传变异的证据,如COLOC中假设4(PP 4)〉0.5的后验概率所反映的。

如果一个反式调节蛋白满足以下三个标准,则认为它具有与因果关系或多效性一致的证据: (i)在p值〈5 × 10−8的转pQTL分析中,它的表达与GWAS显着SNP相关;(ii)在SMR测试中,在FDR p〈0.05时,蛋白质显示了介导GWAS显著SNP和性状之间关联的统计学证据;和(iii)SMR中的关联不是由于连锁不平衡,如HEIDI p〉0.05所反映的。

为简单起见,将符合因果性或多效性的蛋白质称为因果蛋白质。为了检测不同脑区中致病蛋白的表达,作者使用了来自Allan Brain Atlas的标准化微阵列表达数据。微阵列数据包括每个基因的多个探针和每个脑结构的多个样品。通过对每个基因的探针取平均值以及对每个脑结构的样本和脑取平均值,得出每个基因-脑结构对的一个表达值。Z分数使得能够比较不同脑区域中的一个基因的表达。

为了检测不同脑细胞类型中致病蛋白的表达,作者使用了24名认知正常供体dPFC产生的可用人脑单细胞RNA测序数据。对于每种感兴趣的基因和五种主要细胞类型中的每一种,用Wilcoxon秩和检验检测了一种特定细胞类型中的基因表达是否与其他四种细胞类型中的基因表达不同。显著性结果定义为Bonferroni校正的p值〈0.05(对所有17,775个基因进行校正)。

为了确定精神病致病蛋白和神经退行性疾病致病蛋白之间PPI数量的统计学显著性,作者使用了bootstrap方法。如上所述,有407种精神病致病蛋白和44种神经退行性疾病致病蛋白(两组共有13种蛋白),精神病致病蛋白和神经退行性疾病致病蛋白之间有120种物理PPI(s0 = 120 PPI)。从BioGRID数据库(包含8942个蛋白质和487179个相互作用)中随机选择404个蛋白质(因为407个蛋白质中有3个在BioGRID中不存在)和43个蛋白质(因为44个蛋白质中有1个在BioGRID中不存在),分别用于精神病组和神经退行性病变组,确保13种共有蛋白在两组之间共享。然后计算精神病和神经退行性疾病致病蛋白质之间的物理PPI数量。整个过程重复了一万次。

使用2021年7月下载的GO-Elite(v1.2.5)的python命令行版本进行基因集富集分析104,其中包括生物学过程、分子功能、细胞成分、Wiki路径、KEGG 、CORUM 和REACTOME数据库。使用18215个蛋白质的背景,使用Fisher精确检验和Z评分来检验目标因果蛋白中的显著富集。

为了计算118种相互作用的因果蛋白质中突触蛋白质的富集,本文作者使用了最新和最大的突触蛋白质组数据库,其中包含7907种独特的人类蛋白质。为了计算118种蛋白质中线粒体基因的富集,使用了MitoCarta3.0人类精选数据集中的1137种蛋白质。对888个人脑转录组数据应用了类似的分析流程。