重要性: 脑老化会引起复杂的神经解剖学变化,受多种与年龄相关的病理影响。了解老化过程中结构性脑变化的异质性可能有助于深入了解神经退行性疾病的临床前阶段。

      目的: 以数据驱动的方式,在未确诊认知障碍 (WODCI) 的参与者中推导出具有共同变异模式的亚组,并将它们与遗传、生物医学测量和认知衰退轨迹联系起来。

      设计、地点和参与者: 这项队列研究的数据采集时间为 1999 年至 2020 年。数据整合和协调工作于 2017 年 7 月至 2021 年 7 月进行。使用深度学习半监督聚类方法(利用生成对抗网络),在 4 个跨越 45 至 85 岁的十年区间内对特定年龄的脑结构测量亚组进行建模。数据分析时间为 2021 年 7 月至 2023 年 2 月,数据来自老化和神经退行性疾病成像坐标系 (iSTAGING) 国际联盟。纳入了基线扫描时 WODCI 且年龄在 45 至 85 岁之间的个体,数据时间点超过 50,000 个。

      暴露: 基线扫描时为 WODCI(未确诊认知障碍) 的个体。

     主要结果和测量: 在 WODCI 人群中确定了三个跨越十年的亚组。评估了它们与遗传、心血管危险因素 (CVRF)、β-淀粉样蛋白 (Aβ) 和未来认知衰退的关联。

     结果: 在 27,402 名 WODCI (未确诊认知障碍)个体(平均 [标准差] 年龄,63.0 [8.3] 岁;15,146 名女性 [55%])的样本中,与对照组相比,确定了 3 个亚组:一个典型老化亚组 A1,其具有特定的轻度萎缩和白质高信号 (WMH) 负荷模式;以及 2 个加速老化亚组 A2 和 A3,其特征在 65 岁及以上年龄段更为明显。A2 与高血压、WMH 和血管疾病相关的遗传变异相关,并且富集了 Aβ 阳性(年龄 ≥65 岁)和载脂蛋白 E (APOE) ε4 携带者。A3 表现出严重的广泛性萎缩、中度存在 CVRF (心血管危险因素)和更严重的认知衰退。与 A1 相关的遗传变异对 WMH (rs7209235: 平均 [标准差] B = −0.07 [0.01];P 值 = 2.31 × 10−9) 和阿尔茨海默病 (rs72932727: 平均 [标准差] B = 0.1 [0.02];P 值 = 6.49 × 10−9) 具有保护作用,而 A2 则相反 (rs7209235: 平均 [标准差] B = 0.1 [0.01];P 值 = 1.73 × 10−15 和 rs72932727: 平均 [标准差] B = −0.09 [0.02];P 值 = 4.05 × 10−7);A3 中的变异与区域萎缩 (rs167684: 平均 [标准差] B = 0.08 [0.01];P 值 = 7.22 × 10−12) 和白质完整性测量 (rs1636250: 平均 [标准差] B = 0.06 [0.01];P 值 = 4.90 × 10−7) 相关。

     结论和相关性: 这 3 个亚组与 CVRF心血管危险因素)、遗传和随后的认知衰退表现出不同的关联。这些亚组可能反映了多种潜在的神经病理学过程,并影响对阿尔茨海默病的易感性,为早期无症状阶段的患者分层以及在临床试验和医疗保健中促进精准医疗铺平了道路。本文发表在JAMA Psychiatry杂志。

关键点

     问题: 在认知未受损人群中,哪些形态学脑变化模式可重复检测到?它们的遗传、临床、生活方式和认知特征是什么?

     发现: 在这项包含 27,402 名 45 至 85 岁未确诊认知障碍个体的多研究协调队列中,以数据驱动的方式,在跨越十年的年龄组中发现了三种脑结构测量亚组:1 个典型老化亚组和 2 个加速老化亚组,它们与遗传、认知衰退、心血管危险因素和淀粉样蛋白病理学表现出不同的关联。

     意义: 三个遗传上不同且纵向稳定的亚组显示出反映对阿尔茨海默病和其他神经退行性疾病、认知衰退和临床进展的不同易感性的脑变化。

引言

     老化与大脑结构和功能的复杂变化相关。多种遗传、环境和病理因素可能触发、加剧或防止导致神经退行性变及其临床表现的病理生理过程。这些因素可能独立、协同或拮抗作用。常见的与年龄相关的神经病理学,如阿尔茨海默病 (AD) 和血管疾病,具有较长的临床前阶段,在此期间磁共振成像 (MRI) 可以测量早期脑变化。了解早期脑结构变化可能提供关于神经退行性变易感性或存在的预后信息,并为患者治疗和临床试验分层提供信息。

     对正常到早期病理脑老化谱中异质性脑变化的研究需要大型多样化的数据库,这并非个体神经影像学研究的典型特征。新的协调方法允许跨队列的建设性数据集整合,从而实现丰富的荟萃分析。此外,新的人工智能 (AI) 方法,包括深度学习 (DL),允许对细微的脑变化模式进行数据驱动的研究。

     在这里,我们揭示了认知无症状阶段的脑结构异质性,并将其与遗传、生活方式危险因素、β-淀粉样蛋白 (Aβ)、认知和临床数据联系起来。我们将一种基于生成对抗网络 (GAN) 的高级半监督 DL 聚类方法(称为通过 GAN 的半监督聚类 (Smile-GAN))应用于来自 11 项神经影像学研究的大型多样化数据集。我们假设我们可以识别早期结构性脑变异的亚组,这些亚组将与生物医学测量和认知衰退轨迹具有不同的关联。

方法

基于影像的老化和神经退行性疾病坐标系数据

      数据来自基于影像的老化和神经退行性疾病坐标系 (iSTAGING)国际联盟,这是一个合作项目,旨在整合来自 39,000 多名成年人整个生命周期中的神经影像学、临床和认知数据。在这里,我们纳入了基线扫描时年龄在 45 至 85 岁之间且未确诊认知障碍 (WODCI) 的个体(补充 1 中的电子方法 1)的时间点数据,这些数据来自以下研究:阿尔茨海默病神经影像学计划 (ADNI)、澳大利亚影像学、生物标志物和生活方式 (AIBL) 研究、痴呆风险老年对照的生物标志物 (BIOCARD)、巴尔的摩老化纵向研究 (BLSA)、青年冠状动脉风险发展 (CARDIA) 研究、开放获取影像学研究系列 (OASIS)、宾夕法尼亚大学记忆中心队列 (Penn-PMC)、波美拉尼亚健康研究 (SHIP)、英国生物银行、女性健康倡议记忆研究 (WHIMS) 和威斯康星州阿尔茨海默病预防登记 (WRAP)。每项研究的监督委员会都批准将其纳入本项目。宾夕法尼亚大学的机构审查委员会批准了本项目。参与者自我认定的种族和民族类别如下:亚洲人、黑人、白人和其他,其中包括西班牙裔或拉丁裔、多种族、美洲原住民、未知或其他。关于种族和民族的信息按照原始研究中的提供方式呈现。种族和民族信息仅用于描述研究样本,在分析中未予考虑。

      所有参与者均根据《赫尔辛基宣言》向每项研究提供了书面知情同意,用于数据采集和分析。本研究遵循了加强观察性流行病学研究报告 (STROBE) 报告指南。

图像预处理

      应用全自动处理流程从结构 MRI 中提取形态测量变量。校正了 T1 加权图像强度不均匀性,随后进行了多图谱颅骨剥离。使用基于多图谱、多变形标签融合的方法分割了总共 145 个解剖学感兴趣区域 (ROI)。使用 Neuroharmonize 工具箱  (Raymond Pomponio)(补充 1 中的电子方法 2)进行跨研究 ROI 协调。使用基于深度学习的方法从液体衰减反转恢复 (FLAIR) 和 T1 加权图像中分割白质高信号 (WMH)。使用半自动视觉质量检查工具手动审查 WMH 分割。补充 1 中的电子表 3 报告了研究成像参数。

研究设计

     在跨越 45 至 85 岁的 4 个十年年龄区间内独立检查了 WODCI (未确诊认知障碍)个体的脑结构测量亚组;使用十年区间是为了减轻聚类过程中与年龄相关的效应。第一个十年跨越 45 岁至小于 55 岁(记为 45-55 岁)。由于样本数量不足,排除了 85 岁以上的参与者。在每个年龄区间内,对 145 个协调 ROI 体积进行连续年龄、性别和基于深度学习的颅内容积测量 (DLICV) 的线性校正,以避免因与疾病无关的神经解剖学变异而使聚类产生偏差。由于每个区间内的年龄范围有限,因此进行了线性校正。由于偏度,对 WMH 体积进行立方根变换,然后针对相同的协变量进行调整。将校正后的数据标准化为 z 分数。分别对解剖学 ROI 和 WMH 体积应用主成分分析 (PCA)进行降维,最终目标是检测一个萎缩和 WMH 体积低的组,称为弹性脑老化者 (A0)(补充 1 中的电子方法 3 和电子表 4)。使用 A0 作为参考,通过针对每个年龄组独立拟合 Smile-GAN 模型来研究剩余样本中的异质性。Smile-GAN 对 145 个解剖学 ROI 和 8 个脑叶 WMH 体积进行联合训练(补充 1 中的电子表 5)。用于量化神经影像学异质性的聚类方法通常受到与疾病无关的混杂变异性的限制。Smile-GAN 通过学习从参考域 (A0) 到目标域 (非 A0) 的一对多映射,对疾病异质性进行建模,而不会受到在 A0 中可检测到的与疾病无关的因素(例如,人口统计学)的混淆(补充 1 中的电子方法 4)。将基于基线扫描训练的 PCA 和 Smile-GAN 模型应用于每个年龄组内的可用纵向扫描。

模型纵向稳定性

      由于聚类是使用扫描时年龄的模型进行的,我们使用具有纵向扫描的个体研究了在研究定义的年龄十年之间转换是否会影响聚类稳定性/可重复性。我们使用在单个年龄组内保持纵向成像的参与者的稳定性作为参考,评估了在多个年龄组中获得扫描的参与者的纵向聚类稳定性,因此使用独立推导的模型进行聚类。

遗传分析

      使用来自英国生物银行的估算基因分型数据,将 Smile-GAN 概率分数用作全基因组关联研究 (GWAS) 中的表型。我们通过 Plink 2 版本 2.0.0 (Christopher Chang) 执行了多重线性回归,控制了连续年龄、性别、DLICV(颅内容积测量) 和前 40 个遗传主成分。鉴于观察到的纵向聚类稳定性,对整个年龄范围 (45-85 岁) 进行了 GWAS。功能映射和注释用于识别和注释候选单核苷酸变异 (SNV)、独立的显著 SNV、(顶部)主要 SNV 和基因组位点(补充 1 中的电子方法 5)。我们查询了每个基因座内的顶部主要 SNV,以确定基因座是否是新的(以前未与任何临床特征相关联),并查询了候选 SNV 以探索它们在 GWAS 目录上的全表型关联。此外,我们使用全基因组复杂性状分析版本 1.93.2 (Yang Lab)计算了基于 SNV 的遗传力估计值 (h2)。最后,我们将 Smile-GAN 概率分数与我们先前研究中开发的两种晚年抑郁症亚型(LLD1 和 LLD2)的多基因风险评分 (PRS) 相关联。LLD1 的特征是保留了大脑结构,而 LLD2 表现出弥漫性脑萎缩。

统计分析

      体素为基础的形态学测量 (VBM),本队列研究使用了基于体素的形态学测量 (VBM) 方法,该方法在运行于 MATLAB R2017b (Mathworks Inc) 的统计参数映射软件版本 12 中实现,用于比较灰质 (GM) 模式中的亚组差异,使用组织密度图(标准化空间中体积的区域分析 [RAVENS]),并将连续年龄、性别和颅内容积 (DLICV) 作为协变量。多体素检验通过随机场理论控制族系错误率在 0.1% 的水平进行校正。作为基于体素的质量单变量亚组比较的补充,我们还应用了一种称为局部线性嵌入 (LLE) 的流形学习技术,将高维成像模式映射到低维空间,从而可以可视化多变量数据(补充 1 中的 eMethods 6)。

      我们分别检查了每个年龄组中亚组的临床、认知、生物标志物和载脂蛋白 E (APOE) 等位基因关联。分别对连续特征(例如,连线测验 B)和分类特征(例如,吸烟者与非吸烟者)进行线性和逻辑回归。对于具有过度分散和偏态分布的认知结果(例如,MMSE),拟合了 beta-二项分布。回归模型包括亚组标签,同时调整了连续年龄、性别和研究(以及认知评分的教育程度)。对于在多个年龄组中显示一致趋势的特征,将来自多个年龄组的数据汇总在一起,并在更广泛的年龄范围内使用组合数据集中的一个模型重新检查亚组差异,同时考虑研究 × 年龄交互项。使用 Wald 检验评估亚组截距之间的差异。通过控制错误发现率在 5% 的水平,对特征数量进行多重比较校正。

      我们拟合了具有受试者特定随机截距的线性混合效应模型,以估计萎缩、白质高信号 (WMH)、认知、SPARE-AD(早期阿尔茨海默病识别空间异常模式,一种 AD 特异性区域脑萎缩的特征,也被发现可以预测从正常认知到轻度认知障碍 (MCI) 的进展)和 SPARE-BA(基于结构 MRI 的大脑年龄估计)的每年变化率。两种 SPARE 模型先前都经过了验证。线性混合效应模型包括亚组指标、就诊时间及其交互项,同时调整了基线年龄、性别、研究、教育程度和 DLICV。使用 Wald 检验进行变化率亚组比较。纵向分析考虑了具有 4 次或更多纵向测量的个体,以减少斜率估计的不确定性。

      根据参与研究的个体定义的 MCI 的发展(补充 1 中的 eMethods 1)用于指示纵向认知恶化。使用非参数 Kaplan-Meier 估计量生成进展到 MCI 的时间生存曲线;使用对数秩检验比较亚组之间的曲线。所有 P 值均为双侧,P 值 < .05 被认为具有统计学意义。数据分析时间为 2021 年 7 月至 2023 年 2 月。

结果

跨年龄组一致的加速大脑老化模式

      在这项队列研究中,我们纳入了来自世界痴呆症倡议 (WODCI) 的 27,402 名个体(平均 [SD] 年龄,63.0 [8.3] 岁;15,146 名女性 [55%];12,256 名男性 [45%])的 58,113 个时间点。补充 1 中的 eFigure 1 显示了描述样本选择程序的流程图。补充 1 中的 eTable 1 和 2 给出了基线和纵向 (n = 3567) 队列的参与者人口统计数据。参与者自我认同的种族和民族类别如下:313 名亚洲人 (1.1%)、838 名黑人 (3.1%)、23,398 名白人 (85.4%) 和 2,853 名其他 (10.4%)。主成分分析 (PCA) 将 A0 弹性组定义为每个年龄组内萎缩和 WMH 体积最低的参与者。以 A0 为参考,Smile-GAN 显示 3 个聚类 (k = 3) 的最佳稳定性,通过调整兰德指数测量(补充 1 中的 eTable 6)。来自该聚类方案的两种表型用于后续分析。Smile-GAN 亚组概率是直接模型输出,表示每个参与者每个聚类的连续变量,这 3 个概率的总和等于 1;Smile-GAN 亚组是通过取最高概率(主要亚组)来决定的。尽管按年龄段独立得出,但与 A0 相比,Smile-GAN 亚组 A1、A2 和 A3 在萎缩和 WMH 负荷方面显示出一致的差异(图 1A)。A1 显示轻度、主要为peri-Sylvian(外侧裂周围)萎缩。A2 显示更大的peri-Sylvian(外侧裂周围)萎缩,伴有眶额叶和其他前额叶区域的萎缩。A3 在整个大脑中都有弥漫性萎缩,包括内侧额叶区域和丘脑。A2 的 WMH 负担高于其他亚组(图 1B)。在 A1、A2 和 A3 中,A1 的萎缩程度最低,并且是最大的亚组,因此,它可以被认为是典型的衰老。相比之下,A2(病灶最高)和 A3(最严重的萎缩)被认为是加速衰老亚组。由于与较年轻的 A0 组相比,75-85 岁年龄组的 A0 萎缩程度相对较高,并且该年龄组的结构变异性更大,因此在 75-85 岁年龄组内的 VBM 显示亚组间差异不太明显(图 1A;以及补充 1 中的 eFigure 2)。外观最年轻和最老的大脑(A0 与 A3)之间的平均大脑年龄差异约为 10 年,并且在不同年龄组中相对一致(补充 1 中的 eFigure 3)。

图1. 四个年龄组的大脑老化亚组的结构特征

       A.  与各年龄组的A0组相比,Smile-生成对抗网络(GAN)亚组的灰质(GM)体积显著减少(家族错误率 P < .001)。  所有年龄组亚组与45-55岁年龄组A0组之间的基于体素的形态比较见补充资料1中的图2。暖色表示灰质萎缩严重的区域,而冷色表示萎缩程度较低的区域。使用灰色的大脑模板叠加。

      B. 通过对在标准化空间中检查的体积的WMH区域分析(RAVENS)图进行平均计算的平均白质高信号(WMH)图,这些图与每个感兴趣区域内的公共图谱空间对齐。  粉红色表示WMH负荷较低的区域,而白色表示WMH负荷较高的区域。使用灰色的大脑模板叠加。

      C. 从脑体积测量值导出的三维 (3-D) 投影局部线性嵌入空间(补充资料1中的方法6)。  数据点已根据亚组标签进行着色。此投影允许跨年龄组可视化亚组;作为投影,轴本身没有直接意义。LLE 表示局部线性嵌入。

      我们发现,一个年龄区间内的纵向扫描显示聚类分配的一致性约为 85%。我们观察到在 3 年或更短的随访期内进入下一个年龄段的参与者的聚类分配的纵向稳定性约为 80%,即使将完全独立的聚类模型应用于不同年龄段的扫描(例如,使用 55-65 岁模型分类为 A2 的参与者在使用 65-75 岁模型的后续扫描中大多分类为 A2)。此外,补充 1 中的 eTable 7 和 8 分别显示了同一年龄组内和不同年龄组之间两次连续扫描之间的平均 Smile-GAN 概率变化。我们的研究结果表明,跨越十年的概率变化幅度与在同一年龄段内观察到的概率变化幅度相当。

跨越弹性、典型和加速老化的分支连续体

      尽管基于体素的形态学测量(VBM)分析提示各亚组间的主要差异在于严重程度,但对萎缩位置和严重程度差异的检查揭示了各亚组独特的体积指纹。图1C显示了从脑体积测量值导出的三维投影局部线性嵌入(LLE)空间,揭示了A1组比A0组萎缩更严重,随后A2和A3组出现分叉,尤其是在65岁之后。这些轴线反映了径向图中区域测量值之间距离的可变性(补充资料1中的方法7和图4)。LLE(局部线性嵌入)分析中未包含白质高信号(WMH)体积;两轴分叉仅反映萎缩亚组,而不反映WMH负担的显著差异。

临床、认知、生物标志物和 APOE ε4 基因型特征

     我们分别检查了每个年龄组亚组之间在临床和认知特征、β-淀粉样蛋白(Aβ)和 APOE ε4 携带状态方面的差异(补充资料1中的表9)。补充资料1中的图5显示了所检查的完整特征列表及其可用性。在合并数据重新分析后,图2总结了在多个年龄组中显示一致趋势的特征。与心血管疾病(CVD)和WMH(白质高信号)的已知关联一致,我们发现A2组参与者的心血管危险因素(CVRFs)比例最高,包括高血压和肥胖。与A0和A1组相比,A2和A3组吸烟者和糖尿病患者的比例同样较高。

图2. 基线时大脑老化亚组的临床、认知、β-淀粉样蛋白和载脂蛋白E (APOE) ε4 携带状态趋势

      绘制的特征是在多个年龄组中显示一致趋势的非影像特征,在汇集所有年龄组的数据后以摘要形式呈现。图上方的年龄范围表示所检查的更广泛的年龄组。β-淀粉样蛋白状态(阳性 vs 阴性)的定义见补充资料1中的方法8。心血管危险因素和抑郁症状态的确定方法见补充资料1中的方法9。APOE ε4 携带者被认为是具有 1 个或 2 个 ε4 等位基因的个体。箱线图显示了针对每个亚组调整连续年龄、性别和研究(以及认知测试分数的教育程度)后的残差(补充资料1中的方法10)。较高的简易精神状态检查 (MMSE)、数字广度倒背 (DSB) 和加州言语学习测验 (CVLT) 分数表示更好的认知,而较低的连线测验B (TMT-B) 分数表示更好的认知;TMT 分数以倒序排列,因此,较差的认知表现与 4 个图表的方向相同。水平线表示中位数。条形图显示了每个亚组具有各种风险因素的参与者百分比。N 表示图的样本量。对 P 值阈值为 0.05 的多重比较应用了错误发现率校正。在补充资料1的表10中给出了在超过 10 年中发现一致的完整特征列表。
      尽管A2组并未表现出最严重的萎缩,但其APOE ε4携带者的患病率最高,并且在65岁之后,脑Aβ阳性(Aβ+)的比例最高。然而,A2组与A3组相比,APOE ε4携带者和Aβ+患病率更高的趋势没有统计学意义(补充资料1中的表10)。关于Aβ测量,唯一具有统计学意义的差异是A2组与A0组相比,Aβ+的患病率更高。这些发现表明,Smile-GAN亚组均未特指早期AD相关组,但A2亚组的AD病理改变患病率更高。

     尽管参与者被选择为未被诊断为认知障碍,但在55至75岁年龄段,A2和A3加速老化亚组的认知测试表现比A0和A1亚组差。尽管结构特征不同,但A2和A3组在不同认知领域的认知表现没有显著差异。因此,A2和A3组较差的认知表现似乎反映了萎缩和WMH的叠加效应。此外,在55岁之后,A3组出现抑郁症的个体比例最高。

Smile-GAN 概率评分的全基因组关联

     Smile-GAN概率评分(A1、A2和A3)分别与5个、9个和4个基因组位点相关。一些位点先前已被识别,而其他位点则是新的(图3A和补充资料1中的表11)。补充资料1中的图8和表13显示了一个与A2概率评分相关的示例基因组位点。这些先前已识别的位点与各种临床特征相关,包括来自白质微结构(A1-3)、灰质萎缩(A1-3)、WMH(A1-3)、CVRFs(A1-2)、CVD(A1-2)和AD(A1-2)的影像学表型(图3B)。补充资料2中的电子文件中详细介绍了GWAS目录查询。

图3. Smile-生成对抗网络 (GAN) 概率评分(A1、A2 和 A3)的遗传分析

     A.  全基因组关联研究 (GWAS) 确定了与 Smile-GAN 概率评分(A1、A2 和 A3)相关的基因组位点(由顶部主导单核苷酸多态性 [SNP] 表示)。 在所有 GWAS 中均使用全基因组 P 值阈值 (5 × 10^−8)。如果一个位点在 GWAS 目录中未与任何临床特征相关联,我们将其标记为新位点(主导 SNV 以粗体表示)。参考基因组是人类基因组参考联盟构建 (GRCh37)。核型图表示所有常染色体 (1-22)。曼哈顿图和分位数-分位数图见补充资料1中的图6和图7。补充资料1中的图8和表13显示了与 A2 概率评分相关的示例基因组位点。

     B.  来自 GWAS 目录的全表型关联。 每个位点内的独立显著 SNV 与许多临床特征相关,这些特征进一步分为高级组,包括灰质 (GM) 测量值(例如,[皮质下]体积、皮质厚度和表面积)、白质 (WM) 测量值(例如,全脑限制性各向同性扩散和全脑自由水扩散)、心血管疾病(例如,冠状动脉疾病和心肌梗死)、脑血管疾病(例如,非脑叶脑出血和中风)、血液学特征(例如,血小板、嗜酸性粒细胞和白细胞计数)、精神状况(例如,冒险行为和自杀未遂)等。我们还发现了诸如阿尔茨海默病、白质高信号 (WMH)、心血管危险因素、教育程度等个体特征。

      几个单核苷酸变异(SNV)对多个表型/概率产生了多效性影响,且关联效应方向相反例如,A1(平均值[标准差] B = -0.07 [0.01];P值 = 2.31 × 10^-9 和平均值[标准差] B = -0.09 [0.02];P值 = 4.09 × 10^-8)和A2(平均值[标准差] B = 0.1 [0.01];P值 = 1.73 × 10^-15 和平均值[标准差] B = 0.13 [0.02];P值 = 1.04 × 10^-15)与两个新的独立变异(rs7209235和rs55715426,位于细胞遗传区域:17q25.1)相关,其映射基因GALK1和H3-3B与几种CVD生物标志物相关,包括胆固醇和载脂蛋白B。因此,这些变异可能对A1组具有CVD保护作用,但可能对A2组是危险变异。此外,A1(平均值[标准差] B = 0.1 [0.02];P值 = 6.49 × 10^-9)和A2(平均值[标准差] B = -0.09 [0.02];P值 = 4.05 × 10^-7)均与先前与AD PRS(多基因风险评分)相关的候选SNV rs72932727(细胞遗传位置:2q33.2)相关。由于A2组的APOE ε4携带者和Aβ+参与者的患病率最高,与A1组相反,rs72932727可能对A1组具有AD保护作用,而对A2组可能是危险因素。

      最后,A3组的变异与区域萎缩(rs167684:平均值[标准差] B = 0.08 [0.01];P值 = 7.22 × 10^-12)和白质完整性测量(rs1636250:平均值[标准差] B = 0.06 [0.01];P值 = 4.90 × 10^-7)相关。A3与PRS-LLD1(多基因风险评分-晚年抑郁症亚型1)和LLD2(晚年抑郁症亚型2)均显著相关,但关联效应方向相反(LLD1:平均值[标准差] B = -0.05 [0.01];P值 < .001,LLD2:平均值[标准差] B = 0.05 [0.01];P值 = .001)。A1与PRS-LLD1相关(平均值[标准差] B = 0.04 [0.02];P值 = .007),LLD1的特征是脑容量保持(补充资料1中的表12)。此外,影像学表型显示出非常显著的基于SNV的遗传力估计值(A1:h2 = 0.44 [0.04],A2:h2 = 0.55 [0.04],A3:h2 = 0.45 [0.04];所有P值 < 10^-4)。

纵向结果

      在进行过4次或更多次纵向MRI扫描的个体中(n = 670;平均[标准差]随访时间,8.0 [4.7]年;基线平均[标准差]年龄,69.2 [8.9]岁),我们观察到亚组之间在纵向萎缩方面的差异很小(图4和补充资料1中的表14)。A2组的WMH进展速度明显更快(n = 595;平均[标准差]随访时间,8.1 [4.9]年;基线平均[标准差]年龄,69.3 [8.9]岁)。A2和A3亚组的纵向认知下降幅度最大(具有纵向认知评分的个体数量为438至1933,不同测试的平均[标准差]纵向认知测试时间超过5.0 [2.6]年至8.0 [4.7]年,不同测试的平均[标准差]基线年龄超过69.4 [6.5]岁至70.7 [8.4]岁),这与从认知未受损到轻度认知障碍(MCI)的更快进展一致(图4C),强调了基线MRI亚组的长期意义。

图4. 纵向结果

      各感兴趣区域 (ROI) 和白质高信号 (WMH) 体积(单位:mm³)、用于识别大脑老化的空间萎缩模式 (SPARE-BA)、用于识别早期阿尔茨海默病的空间异常模式 (SPARE-AD;无单位)(A)以及使用具有特定受试者随机截距的线性混合效应模型计算的 Smile-生成对抗网络 (GAN) 大脑老化亚组的认知评分(B)的年变化率。 这些模型包括亚组指标、就诊时间及其交互项,同时调整了基线年龄、性别、研究、教育程度和基于深度学习的颅内容积测量值 (DLICV)。使用 Wald 检验进行变化率的亚组比较。N 表示对绘制特征进行 4 次或更多次纵向测量的个体数量。使用错误发现率校正进行多重比较,P 值阈值为 0.05。P 值见补充资料1中的表14。脑室、SPARE 评分、总 WMH 和连线测验 B (TMT-B) 的变化率以倒序排列,因此,更快的大脑老化(表现为更快速的萎缩、病灶累积或认知下降)在所有图表中方向相同。

     C. Kaplan-Meier 生存曲线显示了基线年龄在 65 至 75 岁范围内的个体保持未确诊认知障碍 (WODCI) 且未进展为轻度认知障碍 (MCI) 的概率。  N 表示每个时间间隔的随访个体数量。使用对数秩检验比较 Smile-GAN 亚组的生存曲线。A1 和 A3 曲线之间存在唯一显著差异(P 值 = 0.01)。未显示 A0 的纵向结果,因为 A0 组是使用与 Smile-GAN 亚组不同的方法得出的。此外,纵向 A0 的样本量较小,因此结果不稳健。

CVLT 表示加州言语学习测验;DSB 表示数字广度倒背;GM 表示灰质;MMSE 表示简易精神状态检查;PCG 表示后扣带回;RAVLT 表示雷伊听觉言语学习测验。

讨论

       即使在认知症状出现之前,遗传、生活方式、CVRFs和神经病理学也会对不同个体的大脑老化产生不同的影响。我们将先进的深度学习(DL)方法应用于一个大型、多样化、协调的多队列样本,以寻找大脑变异的特征性神经解剖亚组。在45至85岁之间每十年间隔中都出现了稳定的大脑老化亚组:A1,即具有低萎缩和WMH负荷的典型老化亚组,以及两个加速老化亚组,A2和A3。因此,我们观察到无痴呆认知障碍(WODCI)人群中大脑老化的异质性,其模式在几十年内保持稳定。这些亚组可以从中年开始检测到,并且与心脏代谢和遗传风险因素以及认知相关(图5)。

Aβ 指 β-淀粉样蛋白;APOE 指载脂蛋白 E;CVRF 指心血管危险因素;MCI 指轻度认知障碍;WMH 指白质高信号。

      我们的主要发现之一是出现了两条加速的大脑老化轨迹,从流形算法中可以最清楚地看到,这在65岁及以上的个体中尤其明显。A2与高血压、WMH和血管疾病相关的遗传风险因素相关,GWAS(图3A)证明了这一点,并且与A1的保护作用相反。该亚组的Aβ+(年龄≥65岁)和AD相关遗传风险因素(包括APOE ε4)也略有富集。A3表现出广泛的灰质萎缩和中等程度的CVRFs(心血管危险因素)。因此,A2和A3可能具有不同的大脑储备,从而影响对未来病理的易感性。

       尽管萎缩模式存在差异,但A2和A3的认知功能均比A0差。因此,萎缩和WMH似乎叠加导致认知下降。这可以解释A2组的萎缩程度低于A3组;进一步的萎缩可能导致转化为MCI,从而被排除在这个WODCI队列之外。虽然我们没有定义与神经影像学发现相关的潜在病理,但这种效应与之前的研究结果相当,之前的研究表明,神经退行性和血管病理学的共同参与在认知障碍的早期阶段更为明显。所有亚组的SPARE-AD评分均较低,表明没有明显的AD相关神经退行性变。总体而言,Aβ+个体占少数,并且在各亚组中分布相对均匀,这表明在这个WODCI(未确诊认知障碍)人群中,影响大脑结构老化的因素在症状出现之前可能很大程度上独立于AD。另一方面,A3并未在特定研究的心血管危险因素中独特富集;它具有最高的抑郁症患病率,并且A3概率评分与抑郁症相关的PRS(多基因风险评分)相关。有必要进一步研究A3与其他风险因素的关联,以便更好地了解这一组。

优势和局限性

      这项研究有几个优势,包括大型、多样化、多中心样本覆盖广泛的年龄范围,以及使用先进的协调和DL方法。此外,识别与WMH和脑萎缩相关的多个SNV与亚组的神经影像学特征一致。然而,这项研究也有一些局限性。首先,每个参与研究的抽样策略和数据采集的异质性可能会妨碍推广。其次,淀粉样蛋白数据的可用性较低,tau测量值和与非AD神经退行性变相关的生物标志物的可用性不足。第三,缺乏长期随访,无法就临床进展和向MCI的过渡得出可靠的结论。第四,关于样本组成,存在上限效应,因为具有更严重发现的人更有可能被归类为认知障碍,从而被排除在样本之外。第五,虽然我们观察到各亚组在几十年间的形态学和相关性方面存在一定的相似性,但由于每十年使用不同的模型,并且没有跨越几十年的实质性随访,因此无法证明各亚组在几十年间的等效性。

结论

      在这项多队列研究中,在45至85岁未确诊认知障碍的个体中,确定了由区域萎缩和WMH(白质高信号)负荷定义的一致且可重复的神经影像学亚组。出现了两条加速老化的轴线,一条显示CVRFs(心血管危险因素)升高和脑Aβ富集,另一条显示更弥漫和严重的萎缩。这些亚组可能反映了对AD和其他神经退行性疾病、认知下降和临床进展的不同易感性。