zl程序教程

您现在的位置是:首页 >  硬件

当前栏目

Molecular Psychiatry|青少年焦虑发作:一项机器学习预测

机器学习 预测 一项 焦虑 青少年 发作
2023-06-13 09:18:25 时间

最近对青少年的纵向研究报告了MRI青春期前瞻性焦虑症状的相关性,而青春期是焦虑障碍发病的易感时期。然而,它们的预测价值尚未确定。通过机器学习算法进行个体预测可能有助于缩小与临床相关性之间的差距。采用随机森林、支持向量机和逻辑回归算法的投票分类器,评估感兴趣的灰质体积和心理测量学评分在检测前瞻性临床焦虑中的预测相关性。研究对象为年龄18 ~ 23岁的临床焦虑患者(N = 156)和健康对照者(N = 424)。提取Shapley值对特征重要性进行深度解读。对合并焦虑障碍的前瞻性预测主要依赖于心理测量学特征,达到了中等水平(受试者工作曲线下面积= 0.68),而广泛性焦虑障碍(GAD)的预测达到了相似的性能。仅就心理测量学特征而言,MRI局部体积并不能改善前瞻性合并焦虑症的预测性能,但它们改善了GAD的预测性能,其中尾状核和苍白球体积是贡献最大的特征之一。总之,在非焦虑的14岁青少年中,未来4-8年的临床焦虑发作可以个体化预测心理测量学特征如神经质、绝望和情绪症状是汇总焦虑障碍预测的主要贡献因素。神经解剖学数据,如尾状核和苍白球体积,已被证明对GAD有价值,应纳入前瞻性临床焦虑预测

1. 简介

据报道,焦虑症对全球疾病负担有很高的影响。焦虑症是青少年中最普遍的精神疾病,影响近1 / 3的个体。社交焦虑障碍和特定恐怖障碍的平均发病年龄早于15岁,而惊恐障碍和广泛性焦虑障碍倾向于在生命的稍晚出现。此外,焦虑症在青春期可能会保持不稳定,然后在青年期进一步巩固。因此,发现临床焦虑风险升高的个体至关重要。许多社会人口统计学、心理社会以及身体和精神健康因素已被报告为广泛性焦虑障碍和惊恐障碍的危险因素。神经质和焦虑敏感性等人格评分也被确定为未来焦虑障碍的预先存在的危险因素。生命早期的焦虑气质也是生命后期焦虑障碍的一个强危险因素。此外,神经影像学数据、心理测量学和临床数据显示出识别风险人群的希望。在青少年焦虑障碍患者中,通过磁共振成像(MRI)发现杏仁核、海马、岛叶、扣带回皮质、腹内侧前额叶皮质(vmPFC)和颞回的灰质体积存在横断面差异。此外,纹状体被强调为青少年焦虑症发病的关键皮质下感兴趣区域。焦虑气质模型也被证明涉及幼龄灵长类动物的中央杏仁核、眶额皮质、终纹床核(BNST)和水管周围灰质。然而,只有少数纵向研究从发育的角度研究了青少年焦虑的神经结构相关性。据报道,在4 - 18岁的非临床参与者中,每2年测量3次杏仁核体积与焦虑抑郁症状呈纵向正相关。两项研究基于感兴趣区(roi),但不包括边缘结构。一项研究报道12-13岁时垂体体积较大,2-3年后出现焦虑症状。另一项研究发现,年龄在13 - 20岁的非临床参与者的右侧颞中回皮质厚度较大,可预测2年后出现广泛性焦虑障碍的症状。尽管如此,统计学关联并不一定转化为横断面分类或前瞻性预测,第二和第三项意味着我们有能力将研究结果推广到新的、未见过的数据。在过去十年中,精神病学研究逐步纳入了机器学习方法,努力弥合在群体水平检测到的诊断或预后标志物与临床相关性之间的差距。机器学习技术在使用神经影像数据进行单受试者患者分类方面显示出了前景,而且最近有一项尝试使用更大的样本和多中心数据来克服此类分析的固有局限性。很少有成人研究尝试使用神经影像数据对临床焦虑进行单参与者分类,但样本量有限,性能指标存在异质性,且非前瞻性设计。在成人中,有两项研究以非常小的临床样本量调查了社交焦虑障碍的分类(n患者= 14和20,准确率分别为0.845和0.825),另一项研究以中等大的样本量调查了社交焦虑障碍的分类(n患者= 47,曲线下面积= 0.72),还有一项研究调查了蜘蛛恐怖的分类(n患者= 59,准确率范围为0.62 ~ 0.88)。在每项研究中,分类性能往往不依赖于恐惧回路或其他网络的几个选择结构,而是依赖于整个大脑的弥散预测因子。据我们所知,在青少年中,只有一项前瞻性预测焦虑的尝试,即在7-17岁时的点探测任务中,发现眶额皮质体积和眶额-杏仁核功能连接可预测健康青少年样本一年后的社交焦虑评分(支持向量回归r(predicted, observed) = 0.301)。因此,本研究的第一个目的是基于脑灰质体积以及心理测量学特征(如14岁时的神经质和焦虑敏感性评分),在个体水平预测18和/或23岁时的前瞻性临床焦虑(汇总和特定障碍)。第二个目的是评估灰质体积和心理测量学特征类别对预测性能的贡献。这些分析是在一项先验假设下进行的,即皮质下和额内侧区域的灰质体积可能以及心理测量学特征将对青春期焦虑的发生具有预测价值

2. 方法

2.1 数据集和样本

所有数据均来自IMAGEN数据库,包括收集的社区青少年14岁时的神经影像数据,以及几份评估精神障碍、情绪功能、酒精和物质消费的问卷。本试验从所有参与者及其法定监护人获得了书面知情同意。在基线、18 ~ 19岁(第一次随访,FU1)和22 ~ 23岁(FU2)时使用发展和福祉评估(DAWBA,一种计算机化的自我报告评估,产生DSM-IV和ICD-10诊断)收集诊断数据。这些诊断随后由经过培训的临床医师进行评估,如之前所述。酒精和大麻的消费分别采用AUDIT(酒精使用障碍识别测试)和ESPAD(欧洲酒精和其他药物学校调查项目)进行评估。其他临床评估包括负面思维、物质使用风险描述量表(Substance Use Risk Profile Scale, SURPS)中的焦虑敏感性分量表;力量与困难问卷(SDQ)中情绪症状评分;生活事件问卷(LEQ)中的自主性、事故、苦恼、家庭和搬迁分量表;神经质、外向性分量表(NEO- ffi);以修订的气质与性格量表(TCI-R)测量求新心理。问卷的详细描述见补充方法。在我们的分析中,有T1基线数据的参与者被评估是否符合纳入标准。对每次MRI T1扫描进行视觉质量控制,排除噪声过大、运动伪影或脑解剖结构异常的参与者。基线AUDIT评分≥7分的参与者被排除,因为酒精障碍可能会干扰脑结构发育 (纳入流程图见图1)。

图1 纳入流程在基线、FU1或FU2时被DAWBA诊断为广泛性焦虑障碍(GAD)、社交焦虑障碍(SAD)、特定恐怖症(SpP)、惊恐障碍(PD)、广场恐怖症(AG)和其他焦虑(OA)的参与者被纳入

2.2 MRI采集和预处理

所有扫描均在3T扫描仪(西门子、飞利浦、通用电气)上完成,采用ADNI-MPRAGE标准采集序列(矢状面,重复时间2.3 ms,回波时间2.93 ms,反转角8°,256 × 256 × 160矩阵,体素大小1.1 × 1.1 × 1.1 mm)。采用SPM12中的CAT12工具箱12.6版(http://www.neuro.uni-jena.de/cat/)对MRI数据进行预处理。对t1加权图像进行分割、标准化和调制。使用8 mm全宽半最大值高斯滤波器(最终体素大小:1.5 × 1.5 × 1.5 mm)对其进行平滑处理。

2.3 机器学习预测

特征提取采用SPM12进行提取。从AAL图谱中提取与临床焦虑相关的经典感兴趣区,并通过WFU_PickAtlas工具箱(https://www.nitrc.org/projects/wfu_pickatlas/)将左右半球的感兴趣区合并。感兴趣区包括杏仁核、海马、海马旁回、中扣带回和前扣带回、直回、内侧眶额皮质、壳核、苍白球、尾状核、丘脑、岛叶以及以x = 0、y =−29、z =−12为中心的6 mm范围内的导水管周围灰质(PAG)和BNST。使用MarsBar toolbox软件,在没有额外缩放的情况下,从预处理后的扫描中提取每个ROI的灰质体积,共14个神经影像特征。IMAGEN问卷中与焦虑现象学相关的分量表(包括新奇寻求、情绪症状、自主性、意外事件、痛苦、家庭、搬迁、无望感、焦虑敏感、饮酒、神经质和外向性)经过先验筛选。考虑到基线年龄(天数)与其他特征的潜在交互作用,我们还纳入了基线年龄,因此14岁时共有13个心理测量学特征机器学习流程使用Python中的scikit-learn 0.24.2 (https://scikit-learn.org/dev/versions.html)进行分类。采用了逻辑回归(LR)、支持向量机(SVM)和随机森林(RF)分类器之间的多数投票算法。我们对基线神经影像和心理测量数据进行了三项独立的二元分类预测分析。第一项分析是任何FUA (N = 156) vs.健康对照(N = 424)的预测。第二项分析是FUA诊断GAD (N = 42)对健康对照的预测,第三项分析是FUA诊断mAD (N = 42)对健康对照的预测。仅GAD组和mAD组的FUA参与者超过30人。因此,无法探索其他特定的诊断组。由于FUA组和健康对照组之间的数据存在中度不平衡,因此使用了来自不平衡学习的附加功能0.8.0。FUA SpP组、SAD组和PD/Ag组均包括N<30被试,且不能被单独探索(N=25,N=25,N=22)。首先对27个特征一起用上述三方法进行预测,然后仅对13个心理测量学特征进行预测,仅对14个局部灰质体积特征进行预测,以评估其各自的贡献。我们采用了留-3组的交叉验证策略:在每个交叉验证折叠中,选择5个采集点作为训练数据,其余3个采集点作为测试数据,这样同一站点的任何2个参与者都不能同时处于训练集和测试集(参见参与者跨站点分布的补充方法)。8个位点的所有可能分割共产生56个交叉验证倍数,并对每个交叉验证倍数进行嵌套分层5倍超参数优化,以最大受试者工作曲线下面积(AUROC)。在每个嵌套折叠中,缺失的心理测量数据(整个样本中问卷得分的0.02%,包括FUA和健康对照,N = 580)用特征中位数进行填补,然后对数据进行缩放,并采用过采样和欠采样的组合(合成少数过采样技术和使用默认参数编辑最近邻清洁)进行重采样,使两组的大小相等。分析管道和报告的指标(即10折交叉验证、避免数据泄漏的嵌套预处理、报告为对相对类别频率不敏感的性能指标的AUROC)根据推荐实践进行选择。结果部分报告了56倍以上的平均性能指标。将" liblinear "库设置为LR分类器的求解参数,3种分类器的类权参数均设置为"平衡"。优化的超参数包括LR分类器的最大迭代次数、惩罚和C, SVM分类器的gamma和C, RM分类器的最大深度和最大特征数量。所有其余分类器参数均使用Scikit-learn默认值。为了更仔细地研究每个特征对个体预测的贡献,我们还使用了最近的Shapley加性解释(SHAP)模块,版本0.39.0。SHAP采用博弈论方法为每个特征分配一个重要值,用于个体预测,并允许可视化每个特征值对其最终分类的贡献

3. 结果

3.1 样本特征

在基线时,FUA参与者与健康对照组在年龄、性别和TIV方面没有差异,但他们有显著较高的AUDIT、ESPAD、神经质、焦虑敏感性和情绪症状评分(见补充表1)。此外,与只有一种诊断障碍的FUA参与者相比,FUA mAD参与者的神经质和情绪症状评分显著较高(p值分别为5.5e−3和2.3e−2)。

3.2 机器学习诊断预测

所有分析的所有交叉验证迭代的训练分类器均可在线获得(https://osf.io/pdmrv/)。与健康对照组相比,任何未来的焦虑障碍预测的AUROC = 0.68(标准差(SD) = 0.03)(表1)。类别之间最能区分的特征包括神经质、绝望、情绪症状和家庭事件(图2)。训练后的分类器将较高的值解释为有助于临床焦虑结局分类,而不是有助于健康对照组类别。较大的双侧BNST体积支持健康对照分级结果。FUA预测GAD的AUROC = 0.69 (SD = 0.07)。最具贡献的特征包括双侧尾状核体积、自主性、双侧苍白球体积、外倾性、事故评分、情绪症状和焦虑敏感性,其值较高支持FUA GAD结局分类(图3)。较大的双侧岛叶、BNST和中扣带回体积,以及较高的新奇寻求和迁移评分有助于健康对照分类结果。

图2 与健康对照(N = 424)相比,14岁时SHAP值和特征在预测未来焦虑中的重要性(N = 156)

图3 在预测未来广泛性焦虑障碍(N = 42)与健康对照(N = 424)的14岁特征的SHAP值和重要性FUA mAD预测的AUROC = 0.71 (SD = 0.06)。大多数影响特征包括神经质、情绪症状和PAG体积,较高的值支持FUA mAD结局分类(图4)。较大的双侧壳核、尾状核、BNST、海马和岛叶体积,以及年龄,一般支持健康对照的结局分类。FUA GAD和FUA mAD的预测见补充图1。

图4 与健康对照(N = 424)相比,14岁时的SHAP值和特征在预测未来多重焦虑诊断中的重要性(N = 42)

3.3 影像学特征的贡献

仅基于灰质体积预测任何未来焦虑与健康对照的AUROC = 0.52 (SD = 0.04),仅基于心理测量学特征的相同预测AUROC = 0.69 (SD = 0.03)。仅基于灰质体积预测FUA GAD vs.健康对照的AUROC = 0.63 (SD = 0.06),仅基于心理测量学特征的AUROC = 0.62 (SD = 0.08)。仅基于灰质体积预测FUA mAD vs.健康对照的AUROC≤0.50 (SD = 0.06),仅基于心理测量学特征预测的AUROC = 0.74 (SD = 0.05)。

4. 讨论

这是第一份使用区域灰质体积和14岁时获得的临床特征预测18 ~ 23岁欧洲青少年焦虑发作的报告。我们还研究了灰质体积单独对未来焦虑障碍的预测价值。当将所有未来焦虑诊断汇总在一起时,预测性能高于偶然性水平,其中最有贡献的特征是神经质和绝望评分。未发现经典焦虑感兴趣区的神经影像学特征对合并焦虑障碍的预测有贡献然而,14岁时的双侧尾状核和苍白球体积是对18 -23岁时纯GAD的特异性预测的主要贡献因素,两个区域的体积较大表明未来的GAD诊断。此外,预测未来青春期晚期多发性焦虑障碍(mAD)涉及较大的导水管周围灰质体积

4.1 GAD, mAD和合并诊断的预测特征

由于没有预先存在的青少年未来焦虑的预测研究,我们的预测性能只能通过最近的两个前瞻性抑郁和双相障碍的预测来进行评估(AUROC分别为0.72和0.76)。事实上,结合使用心理测量学和神经影像学特征,我们对合并焦虑诊断的预测性能非常接近(AUROC = 0.68),而我们的随访时间更长(两项研究的随访时间均为8年vs. 5年)。但仍需进一步改进,以使前瞻性焦虑个体预测具有临床应用价值。在我们的分析中,仅就心理测量学数据而言,区域性灰质特征对合并焦虑的预测没有增加贡献。此外,仅局部灰质特征对合并诊断或mAD的预测能力较差(AUROC分别为0.52和≤0.50)。缺乏增量准确性的一个可能解释是我们分析中使用的特征数量有限(在局限性中讨论)。事实上,一些使用神经影像数据的焦虑预测研究报告了大脑对预测性能的广泛贡献。与杏仁核、前岛叶、终纹床核、海马和vmPFC相比,纹状体在焦虑研究中经常被忽视。然而,它的潜在重要性,特别是在青春期焦虑的出现,在过去的研究中已经被强调。我们的发现与这一观点一致,在基于体素的形态学组分析中,未来GAD参与者的尾状核和苍白球体积也显著大于健康对照者(补充图2b和补充表3b)。此外,基线mAD参与者的导水管周围灰质显著较大(见补充图2a和补充表3a)。导水管周围灰质参与防御行为和疼痛处理,但20多年来也与恐惧、焦虑和焦虑气质有关,尽管它经常被其他节点(如杏仁核、vmPFC和BNST)所掩盖。然而,当使用所有27个特征时,与心理测量问卷相比,其对前瞻性mAD的预测价值仅为中等。在汇总的焦虑样本中,神经质是对未来焦虑最具预测性的特征。尽管在我们的数据集中,神经质是与焦虑最相关的心理测量子量表,但它并不是临床严重程度和焦虑症状的简单衡量指标。相反,神经质是一种与经历强烈的负面情绪和内化障碍密切相关的人格特质。

4.2 强度

普遍适用性是个体预测中的一个传统问题,本文讨论了其中的一些问题。首先,IMAGEN队列包括从欧洲多个采集点收集的社区青少年数据,并有8年的随访时间,涵盖了从青少年到青年的脆弱性窗口期,因此具有良好的生态效度。据我们所知,IMAGEN是目前可获得的从青春期到成年早期的最大的神经影像学队列。其次,我们的机器学习分析包括一个最先进的流程,其中包含适当的嵌套交叉验证程序,以避免样本量有限和数据不平衡。我们的交叉验证策略尤其优于传统的k倍验证策略(见补充结果),以利用IMAGEN数据集的多中心特性,努力提高预测性能的普适性。最后,使用SHAP最大化可解释性。

5. 结论

本研究证实,使用多中心方法可以对青少年的临床焦虑进行前瞻性和个体化预测,尽管预测效果一般。预测性能显示,容易收集的心理测量学特征,主要是神经质、绝望和14岁时的情绪症状,对合并焦虑诊断的预测有很大贡献。因此,本研究结果进一步支持以下观点:对青少年的这些临床特征进行自我筛查有助于早期发现焦虑障碍。此外,特定的焦虑诊断依赖于一些区域性灰质特征,如纹状体体积,值得进一步研究它们与发展性焦虑的关系。