在过去的十年中,广泛的研究已经考察了人脑分割成大规模功能网络的过程。由此产生的网络图谱,即脑图谱,现在常用于先验识别功能网络。然而,这些脑图谱的使用,特别是在发育和临床样本中,依赖于四个基本假设:

    (1)各种脑图谱同样能够恢复感兴趣的网络;

    (2)源自成人的脑图谱能够很好地代表儿童大脑中的网络;

    (3)网络属性,如网络内连接,在不同脑图谱中能够被可靠地测量;

    (4)脑图谱的选择不会影响关于特定网络属性的个体差异结果。

      在本研究中,我们使用八种常见的脑图谱方案在两个独立的发育样本中检验了这些假设。我们发现,这些脑图谱在儿童和成人中同样能够捕捉到感兴趣的网络。然而,不同脑图谱中同名的网络(例如,默认网络)并不能产生可靠的网络内功能连接测量。关键是,脑图谱的选择显著影响了功能连接与年龄、贫困和认知能力之间关联的程度,从而基于脑图谱选择在解释功能连接的个体差异时产生了有意义的差异。我们的研究结果表明,使用脑图谱的研究可能受益于使用多种方案以确认结果的稳健性和普遍性。此外,研究人员希望深入了解功能网络时,可能会受益于采用更细致的网络识别方法,例如使用密集采样数据来生成个体导向的网络图谱。向精准神经科学的过渡将为在发育过程中和临床人群中表征功能性脑组织提供新的途径。本文发表在Neuroimage杂志。

关键词:脑图谱、静息态功能连接、一致性、个体差异、发展、皮层网络

1. 引言

     人类大脑被分割成一系列由广泛分布的区域组成的大规模功能网络。对这些功能网络的探索采用了多种技术,包括聚类方法如高斯混合模型(Lashkari 等,2010;Yeo 等,2011)、元分析连接方法(Eickhoff 等,2011;Power 等,2011)、边缘检测方法(Gordon 等,2016;Laumann 等,2015)、多模态方法(Glasser 等,2016)以及其他许多方法(Schaefer 等,2018;Baldassano 等,2015;Blumensath 等,2013;Smith 等,2009)。这些研究产生了众多详细描述各功能网络所包含特定脑区的脑图谱方案。尽管这些脑图谱的主要目标是揭示大脑组织结构,认知、发展和临床研究常常使用这些图谱作为识别受试者中功能网络的手段,以基于认知(Lopez 等,2019;Murphy 等,2020)、年龄(Jalbrzikowski 等,2019;Lopez 等,2019;Satterthwaite 等,2013;Sylvester 等,2018)或精神病理存在(Fan 等,2019;Lydon-Staley 等,2019;Reggente 等,2018;Yu 等,2019)来考察大脑功能组织的个体差异。

     脑图谱被用来从预先识别的功能网络所包含的一组脑区或脑区域中提取数据。然后,这些数据被用来考察网络特定的属性,如网络内连接(Fan 等,2019;Karcher 等,2019;Lydon-Staley 等,2019;Yu 等,2019),或图论指标如全局效率和模块化(Bullmore 和 Sporns,2009;Grayson 和 Fair,2017;Stumme 等,2020),以得出关于大脑功能的全局属性以及发展过程中或临床群体中网络属性的个体差异的结论。这些图谱在认知神经科学中得到了广泛应用(Geerligs 等,2015;Finc 等,2020;Murphy 等,2020;Weis 等,2020),尤其是在发展(Baum 等,2020;Karcher 等,2019;Lopez 等,2019;Tooley 等,2020)和临床研究中(Fair 等,2013;Xia 等,2018;Yerys 等,2019),这使得对功能性大脑组织中个体差异的广泛探索成为可能。

     脑图谱的应用已成为常态。然而,这一做法基于四个主要假设(见图1),据我们所知,这些假设尚未经过实证评估。第一个假设是,所关注的网络在从图谱中提取的数据中得到了良好的恢复,因此提取的数据可用于构建网络特定的测量。此外,由于大多数研究依赖于单一的图谱,因此假设各种图谱同样能够捕捉或重现所关注的网络。鉴于成人来源的图谱经常应用于发展样本的数据(Alarcón 等,2018;Fair 等,2013;Jalbrzikowski 等,2019;Lopez 等,2019;Satterthwaite 等,2013;Sylvester 等,2018;Yerys 等,2019),第二个假设是这些图谱能够反映儿童功能网络的拓扑结构,因此这些图谱能够在发展样本中准确捕捉所关注的网络。第三,许多现有的图谱共享高度相似的标签方案,其中在不同图谱中空间范围相似的网络也拥有相同的网络标签(例如,“默认网络”、“背侧注意网络”等)。这种共享标签导致了一个假设,即跨图谱表示的网络可以被视为类似的。换句话说,在图谱方案A中识别的默认网络与在图谱方案B中识别的默认网络是相同的网络。因此,假设这些图谱能够可靠地测量网络属性,如网络内平均连接性。最后,尽管一些研究使用一系列图谱重复结果(Finc 等,2020;Finc 等,2021;Geerligs 等,2015;Luppi 等,2021;Tooley 等,2020;Xia 等,2018),大多数研究仅使用单一图谱。这种做法假设各种图谱可以互换,因此图谱的选择不会影响所获得结果。

图1. 使用先验脑图谱研究发展和临床研究中功能性大脑组织的个体差异的四个主要假设。

      在本研究中,我们检验了这四个假设。为此,我们选择了一组常用的脑图谱方案(Glasser 等,2016;Gordon 等,2016;Power 等,2011;Schaefer 等,2018;Yeo 等,2011)。我们还感兴趣于评估元分析平台 NeuroSynth 在生成合理网络图谱方面的能力。NeuroSynth.org 允许研究人员使用关键词识别任务诱发的活动映射(Yarkoni 等,2011;Lieberman 和 Eisenberger,2015)。由于研究人员在讨论任务诱发活动时经常提到主要功能网络,主要功能网络也开始使用 NeuroSynth 的元分析方法来识别(Franzmeier 等,2017;Wang 等,2020)。我们有兴趣检验 NeuroSynth 平台识别功能网络的能力,因此包括了使用 NeuroSynth.org 生成的四个主要感兴趣网络(默认网络、控制网络、背侧注意网络和突显网络)的图谱。

       使用选定的八种脑图谱方案,我们考察了以下问题:(1)这些脑图谱是否同样能够恢复所关注的网络(即,图谱提取的数据是否能够重现图谱定义的预期相关网络结构)?(2)这些源自成人的脑图谱是否能够很好地代表儿童大脑中的网络?(3)网络属性,如网络内连接性,是否在不同脑图谱中被可靠地测量?(4)所选择的脑图谱是否会影响关于网络属性个体差异的结果?为了评估第四个假设,我们考察了关于功能性大脑组织中个体差异的三个常见问题,包括功能连接性是否随年龄、环境经验和认知能力而变化。在这里,我们重点关注贫困作为环境经验的一个衡量指标。我们在两个大型的儿童和青少年样本中检验了这四个假设,重点关注四个主要感兴趣的网络,这些网络被广泛研究并通过脑图谱方案生成:默认网络、控制网络、背侧注意网络和突显网络。

2. 方法

      我们在两个大型的儿童和青少年样本中实施了所有分析,这些样本收集了年龄、环境经验(例如贫困)和认知能力的信息。

样本1

      一个160名年龄在8-17岁之间的青少年样本于2015年1月至2017年6月在西雅图地区招募参与。其中38人被排除,原因如下:在扫描过程中入睡(4人),静息态扫描不完整(5人),由于数据不足未能成功完成预处理(22人),或扫描出现其他技术问题(7人)。最终分析样本包括122名年龄在8-17岁之间的受试者(平均年龄 M = 12.8 岁,标准差 SD = 2.64;59 名男性),拥有良好的静息态功能磁共振成像(rsfMRI)数据(扫描时间 6 分钟)。这些数据是作为一个更大研究的一部分收集的,该研究旨在调查童年虐待对大脑结构和功能的影响。最终样本中有64名受试者经历过虐待(Weissman 等,2020)。我们选择这个样本是因为其在年龄、环境经验和认知能力方面具有广泛的变化——这些因素是用于检验第四个研究问题的个体差异分析的重点。该样本为检验脑图谱选择是否影响因这些特征而观察到的个体差异的幅度提供了极好的机会。

样本2

     我们使用了儿科影像学、神经认知和遗传学(PING)研究的数据。PING 数据库通过 PING 门户网站向研究人员公开,包含1493名年龄在3至21岁之间的儿童和青少年的多模态神经影像数据、发展历史以及行为和认知评估。其中643名参与者有 rsfMRI 数据。由于扫描时间或质量不足,排除了313名受试者。最终样本包括330名年龄在3-21岁之间的参与者(平均年龄 M = 14 岁,标准差 SD = 5;153 名男性),拥有良好的 rsfMRI 数据(扫描时间 6 分钟)。有关 PING 数据收集和数据库的详细描述,请参见 Jernigan 等(2016)。我们选择这个样本是因为其规模大且年龄范围广——这使我们能够检验脑图谱方案是否影响网络属性个体差异的幅度,作为年龄的函数。

影像采集

     样本1 扫描是在华盛顿大学综合脑成像中心使用32通道头线圈的3T Phillips Achieva 扫描仪上进行的。采集了 T1 加权 MPRAGE 体积(重复时间 TR = 2530 ms,回声时间 TE = 3.5 ms,翻转角度 = 7°,视野 FOV = 256 × 256,176 层,面内体素大小 = 1 mm³)用于与 fMRI 数据的共配准。功能扫描期间采集了血氧水平依赖(BOLD)信号,使用梯度回波 T2*-加权回声平面成像(EPI)序列。37 个 3 毫米厚的切片按顺序并平行于 AC-PC 线采集(TR = 2 秒,TE = 25 ms,翻转角度 = 79°,层间间隙 = 0.6 mm,视野 FOV = 224 × 224 × 132.6,矩阵大小 = 76 × 74)。每次扫描前,采集了四张图像以允许纵向磁化达到平衡。

     样本2 在九个儿科影像学、神经认知和遗传学(PING)站点和12台扫描仪上实施了标准化的多模态高分辨率结构性 MRI 协议:约翰霍普金斯大学(Philips – Achieva);麻省总医院(Siemens – TrioTim 1);麻省总医院(Siemens – TrioTim 2);加州大学戴维斯分校(Siemens – TrioTim);加州大学洛杉矶分校(Siemens – TrioTim 1);加州大学洛杉矶分校(Siemens – TrioTim 2);加州大学圣地亚哥分校(GE – Signa);加州大学圣地亚哥分校(GE – Discovery);夏威夷大学(Siemens – TrioTim);马萨诸塞大学(Philips – Achieva);威尔康奈尔医学院(Siemens – TrioTim);耶鲁大学(Siemens – TrioTim)。该协议包括传统的三个平面定位器,一个矢状面 3D 反转恢复破坏梯度回波 T1 加权体积,优化了灰质/白质对比度最大化(回声时间 TE = 3.5 ms,重复时间 TR = 8.1 ms,反转时间 TI = 640 ms,翻转角度 = 8°,接收带宽 = ±31.25 kHz,视野 FOV = 24 cm,频率 = 256,相位 = 192,切片厚度 = 1.2 mm)。测量并校正了所有扫描仪的弛豫率和扫描仪特定的梯度线圈非线性变形。所有站点还采集了矢状面 3D 立方体 T2 加权体积、梯度回波平面成像扫描和静息态功能性 MRI 的相关校准扫描。大多数在圣地亚哥和檀香山采集的数据实施了非扩散成像采集的前瞻性运动校正。协议中每个序列的扫描时长为 T1 8 分 5 秒,T2 4 分 25 秒。有关样本2影像数据的详细说明,请参见(Fjell 等,2012;Jernigan 等,2016),有关站点特定扫描仪协议,请参见 https://nda./edit_collection.html?id=2607。

静息态fMRI预处理

      来自样本1和样本2的静息态fMRI(rsfMRI)数据按照 Ciric 等人(2017)关于最佳减少运动伪影影响的指南进行了预处理,预处理流程使用 Make 软件工具实现,该工具允许集成多种软件包(Askren 等,2016)。静息态扫描的前四个体积(volume)被舍弃。然后,我们使用 FSL 的 MCFLIRT(Jenkinson 等,2002)将时间序列配准到中间体积(volume)。为将每个受试者的静息态时间序列配准到其 T1 图像、从 T1 图像到样本特定模板以及从该模板到蒙特利尔神经学研究所(MNI)空间,估计了线性和非线性变换。功能数据与每个参与者的 T1 加权图像的解剖配准和归一化使用高级归一化工具(ANTs)软件,版本 2.1.0,因其在儿科样本中的优越配准效果(Avants 等,2011)。接着,我们进行了切片时序校正(使用 FSL 的 slicetimer)(Jenkinson 等,2002),使用 AFNI 的 3dDespike(Cox,1996)替换异常体素值,并使用 6 毫米全宽半高(FWHM)的高斯平滑核进行高斯空间平滑(FSL SUSAN)(Smith 和 Brady,1995)。随后,我们使用 AFNI 的 3dDeconvolve(Cox,1996)从时间序列中回归噪声变量。这些变量包括:帧间位移超过 0.5 毫米的体积回归器、脑内 BOLD 信号方差导数(DVARS)超过上限(75 百分位数以上加 1.5 倍四分位距)的回归器,或信号强度超过均值 3 个标准差的回归器。我们还包括了总共 18 个其他噪声回归器,包括六个运动参数及其六个导数、脑脊液和白质的信号(在平滑前提取)及其导数,以及全脑所有体素的平均信号(即全局信号)及其导数。我们没有使用推荐的额外 18 个回归器(代表模型中包含的每个 18 个回归器的平方项)(Ciric 等,2017),因为这样做需要的有效自由度不足,且在两个样本中相当比例的参与者在包含这额外 18 个回归器时预处理失败。我们选择使用数据允许的最佳策略以保留更多数据,同时在每个样本中保留尽可能多的受试者。这一选择不太可能对我们的结果产生有意义的影响,因为我们的目标仅是评估使用哪种 8 种脑图谱方案会在网络属性上产生差异。然后,数据使用 AFNI 的 1dBport 进行了带通滤波,以保留频率范围在 0.01 Hz < f < 0.8 Hz 之间的信号。预处理后,保留至少有 4.5 分钟数据的受试者。样本1中被标记的时间点的中位百分比为 7.5%,范围为 0−23%。样本2中被标记的时间点的中位百分比为 8.6%,范围为 0−29%。

脑图谱选择

       我们选择了在发育和临床研究中常用的八种脑图谱方案,包括 Power 2011 方案(Power 等,2011)、Yeo 2011 的 7 网络图谱(Yeo 等,2011)、Gordon 2016 图谱(Gordon 等,2016)、Glasser 2016 图谱(Glasser 等,2016)以及 Schaefer 2018 图谱方案中的三种(100、200 和 400 区块方案)(Schaefer 等,2018)(见图2)。我们还包括了来自 NeuroSynth 平台的网络方案(Yarkoni 等,2011)。为了创建 NeuroSynth 映射,我们下载了四个感兴趣网络的前向推理(均匀性测试)元分析术语图谱:默认网络、控制网络、背侧注意网络和突显网络。这些图谱通过在 www.neurosynth.org 上使用以下关键词搜索识别:“default mode network”(默认模式网络)、“control network”(控制网络)、“dorsal attention network”(背侧注意网络)和“salience network”(突显网络)。对于获得的每个四个图谱,我们在每个图谱的活动集群中识别峰值,并在峰值周围绘制 4 毫米的球体,从而创建基于体积(volume)的掩模,随后可用于提取时间序列数据。我们承认这些脑图谱是使用不同的分析方法生成的,然而本文的重点并不是检验这些方法中任意一种相对于其他方法的有效性。相反,我们感兴趣的是检验这些图谱一旦建立,作为先验网络方案应用时的比较情况。

图2. 评估所选的八种脑图谱方案:Glasser 2016、Gordon 2016、NeuroSynth(关键词:“default network”、“control network”、“dorsal attention network”、“salience network”)、Power 2011、Schaefer 2018(100、200、400)、Yeo 等(2011)。图例详细说明了所选的四个感兴趣网络:默认网络、控制网络、背侧注意网络和突显网络。

感兴趣的网络

      为了进行本次评估,我们专注于四个感兴趣网络:默认网络(DN)、额顶控制网络(CN)、背侧注意网络(DaN)和突显网络(SaN)。我们选择专注于这四个网络,因为它们在发育和临床研究中受到了最多的关注。此外,这四个网络包含在所有八种脑图谱中,并且每个图谱中至少由两个或多个区块组成——这是评估网络内连接性(即计算网络中各区域之间的相关性)的必要条件。在 Yeo 图谱中,听觉、视觉和体感运动网络不符合这一规格,并且在临床和发育研究中研究得较少。因此,我们在分析中未包括听觉、视觉或体感运动网络。如图2所示,默认网络、控制网络和背侧注意网络在八种脑图谱中标记方式相似。需要注意的是,我们所称的“突显网络”是标记最不一致的网络,“cingulo-opercular”(扣带-盖区网络)和“ventral attention”(腹侧注意网络)是用于描述通常包括前岛叶、背侧前扣带皮层和背内侧前额叶皮层其他区域的网络的其他名称。有关不一致的网络命名如何阻碍研究结果的清晰综合以及提出的通用分类法的讨论,请参见 Uddin 等人(2019)。所有分析都集中在这四个感兴趣网络上,以评估这八种脑图谱方案。

脑图谱配准和时间序列提取

      预处理完成后,将每种八种脑图谱方案配准到每个受试者的静息态功能数据中。对于两种基于体积(volume)的方案(Power 2011 和 NeuroSynth),使用 ANTs(通过 antsApplyTransforms 函数)将脑图谱从 MNI 空间配准到研究特定模板,再到本地 T1 空间,最后到本地静息态功能空间(Avants 等,2011)。每种基于体积的方案配准到每个受试者的功能本地空间后,使用 FSL 的 fslmeants 函数提取每个区块的平均 BOLD 时间序列。对于六种基于表面的脑图谱(Yeo 等,2011;Gordon 等,2016;Glasser 等,2016;Schaefer 等,2018 [100、200、400]),首先将受试者的本地静息态功能数据投影到表面上(使用 FreeSurfer 的 bbregister 和 mri_vol2surf 命令)。然后,使用 FreeSurfer 的 mri_surf2surf 函数将每种脑图谱方案配准到受试者的表面空间。最后,使用 FreeSurfer 的 mri_segstats 函数提取每个区块的时间序列。所有后续分析均使用提取的时间序列数据进行。

2.1. 数据分析

解决问题1的方法:脑图谱是否同样能够恢复所关注的网络?

      当使用先验脑图谱时,假设所关注的网络在提取的时间序列数据中得到了很好的表征,并且各种脑图谱同样能够表示所关注的网络。为了评估这一假设,我们采用了一种技术,可以评估数据自然聚类到预定义分组的程度,这些分组与感兴趣的功能网络一致。该技术依赖于评估多维缩放(MDS)程序的两个版本之间拟合优度的差异:无约束和有约束的MDS,这是通过R语言SMACOF包(版本2.1.0;De Leeuw and Mair, 2009)在R版本4.0.0(R Core Team, 2020)中实现的。我们简要描述MDS,并解释如何结合使用无约束和有约束的MDS来评估感兴趣的网络在从各种分区方案中提取的时间序列数据中的表示程度。

多维尺度分析

     MDS(多维缩放)是一种探索性无监督学习技术,允许使用空间配置来可视化多变量数据集中一组项目之间的相关性(Borg 和 Groenen,2005;Borg 等,2018)。MDS分析的主要结果是一个图形绘图,或配置,空间上展示项目的相似性,使得高度相关的项目在空间中彼此靠近,而负相关的项目在空间中相距较远。如果两个项目在MDS配置中出现在空间的完全相同位置,这些项目是完全相关的。参见图3A,展示了MDS配置的可视化,其中显示了使用Yeo等(2011)提取的单个受试者的脑区时间序列之间的相似性。要使用相关矩阵进行MDS分析,首先使用下面的方程将矩阵转换为非相似性矩阵,这是smacof包中MDS函数所需的输入:

图3A单个受试者从Yeo等人(2011)脑图谱提取的四个感兴趣网络的时间序列数据的无约束MDS解决方案。在此配置中,时间序列数据清晰地分离为感兴趣的网络。
B:单个受试者从Yeo等人(2011)脑图谱提取的四个感兴趣网络的时间序列数据的约束MDS解决方案。尽管约束MDS解决方案的应力值有所增加,但在添加网络约束后,应力评分并未受到显著影响,因为网络分组在无约束解决方案中已存在。
C单个受试者从NeuroSynth方案提取的四个感兴趣网络的时间序列数据的无约束MDS解决方案。在此配置中,时间序列数据未能清晰地分离为感兴趣的网络。
D:单个受试者从NeuroSynth方案提取的四个感兴趣网络的时间序列数据的约束MDS解决方案。即使在约束MDS解决方案中,NeuroSynth数据仍未能清晰地分离,这反映在较大的应力评分上。NeuroSynth方案的无约束和约束MDS解决方案之间应力评分的巨大差异表明,所关注的网络在该受试者提取的时间序列数据中表现不佳。

      这里,r(x,y) 表示向量(此处为脑区时间序列)x 和 y 之间的皮尔逊相关系数。通过将相关矩阵(其中较大的值表示相似性)转换为非相似性矩阵(其中较小的值表示相似性),变量 (x, y) 之间的关系因此由可绘制的接近度或距离 d(x,y) 表示。然后,非相似性矩阵用于在低维空间中(通常为二维,便于可视化)求解空间配置,其中配置解决方案中点之间的距离尽可能接近给定的输入非相似度(接近度)(Mair,2018)。用于识别理想配置解决方案的最小化(拟合优度)函数称为应力。其值(应力值)量化了配置图中项目之间的距离与原始输入矩阵中距离的相等程度。在理想的解决方案中(应力值为0),配置图中点之间的距离与输入距离矩阵中的距离之间不会有差异。MDS 技术有多种类型,最常见的是无约束 MDS(Mair,2018),其中对配置解决方案不施加任何结构性约束。无约束 MDS 产生最低可能的应力值(即,产生的配置使得图中项目之间的距离最接近给定输入非相似性矩阵中项目之间的接近度)。另一方面,约束 MDS 允许用户使用先验分组限制配置解决方案;属于相同先验分组的项目被强制在空间上彼此接近(Borg 和 Lingoes,1980;De Leeuw 和 Heiser,1980;Heiser 和 Meulman,1983;Mair,2018)。这是通过将配置空间划分为先验分组的数量,并约束每个组的所有项目落在其指定区域内来实现的。由于约束 MDS 不允许自由解决方案,应力值必然会更大。

    如上所述,当使用先验脑图谱时,假设所关注的网络在提取的时间序列数据中得到了表示。本研究的分析基于这样一个理念:如果网络分组确实在提取的时间序列数据中得到了表示,则每个网络的数据应在无约束 MDS 解决方案中聚集在一起。
    下图 图3A图3C 展示了单个受试者从 Yeo 等人(2011)脑图谱和 NeuroSynth 图谱中提取的四个感兴趣网络的时间序列数据的无约束 MDS 配置图。通过检查无约束图,可以看到来自 Yeo 等人(2011)脑图谱的时间序列数据自然地分离为四个感兴趣的网络。然而,来自 NeuroSynth 映射的时间序列数据未能分离为可识别的网络分组。我们可以通过拟合区域约束的 MDS 解决方案来量化时间序列数据在感兴趣网络中的聚类程度。在约束 MDS 中,每个脑图谱定义的给定网络(即分组)内区域的时间序列被强制落在 MDS 空间的同一约束部分(例如,SaN 区域的时间序列位于左上象限,DN 区域的时间序列位于右上象限,DaN 区域的时间序列位于左下象限,CN 区域的时间序列位于右下象限)。这在概念上等同于网络模型中节点的聚类。

       应力值(即拟合优度)在无约束和约束解决方案之间的变化可以被评估。如果网络分组确实在数据中得到了表示,则在约束MDS解决方案中强制数据聚类只会对应力值产生小的影响,因为数据已经自然地分布到不同的空间分组中。因此,无约束和约束MDS之间的应力值差异应该很小。然而,如果时间序列数据未能自然地聚类到网络分组中,约束MDS的应力值将显著更高,因此无约束和约束MDS解决方案之间的应力(或拟合优度)变化将很大。因此,我们可以利用无约束和约束MDS解决方案之间的应力值差异来评估给定脑图谱提取的时间序列数据中所关注网络的表示程度。

     图3B和图3D展示了与无约束MDS解决方案相同单个受试者的Yeo等人(2011)脑图谱和NeuroSynth方案的约束MDS解决方案。如图所示,Yeo等人(2011)约束MDS解决方案的应力值为0.212,因此应力差异为0.054,而NeuroSynth的无约束和约束解决方案之间的应力差异则高达0.235。这表明对于该受试者,Yeo等人(2011)脑图谱在表示所关注的网络方面明显优于NeuroSynth方案。因此,应力差异指标可以用来确定给定脑图谱提取的时间序列数据中所关注网络的表示程度。

      为了评估所关注的网络是否在提取的时间序列数据中被同等表示,我们为每个受试者计算了每种八种脑图谱方案的约束和无约束MDS解决方案之间的应力差异。请注意,要解决MDS解决方案,需要一个初始的起始配置,然后对其进行优化。我们选择使用Torgerson配置(经典MDS)作为无约束MDS的初始起始配置(而不是随机起始),因为这种初始起始通常会产生最低的应力值,并进一步产生非随机的MDS解决方案(Borg和Mair,2017;Mair等,2016)。然后,我们拟合了一个混合效应模型,以检验应力差异(因变量)是否在脑图谱方案之间显著变化(自变量),并且观测值嵌套在受试者内(即,受试者ID与随机效应相关)(见下文R模型语法)。

     所有混合效应建模使用lme4包版本1.1.23(Bates等,2015)在R版本4.0.0(R Core Team,2020)中完成。

      尽管MDS已被用于检验静息态网络(Gratton等,2018),但它并未被频繁用作量化皮层网络的方法。因此,我们进行了第二项分析,使用更常用的图论方法来确认这些结果,特别关注网络模块化。通过比较数据驱动聚类方法(walk trap)的模块化与应用先验网络分组时的模块化差异,我们能够使用另一种方法评估先验网络在提取数据中的表现程度。有关这些分析的更多细节,请参见补充材料。

解决问题2的方法:这些源自成人的脑图谱是否能够很好地代表儿童大脑中的网络?
      迄今为止,所有脑图谱方案都是在大型成人样本中开发的。因此,在发育样本中应用这些脑图谱方案假设所关注的网络在儿童和成人中以相同的方式和相同的程度得到表示。为了评估这一假设,我们通过添加年龄项以及年龄与脑图谱的交互项,扩展了用于检验脑图谱应力差异的层级线性模型(上述描述)。为了测试交互项是否显著,我们将这一扩展模型与一个仅包含年龄但不允许其与脑图谱交互的模型进行了比较。此比较使用了似然比检验(见下文R模型语法)。
.    如果源自成人的脑图谱能够在儿童和青少年中同样有效地捕捉网络,那么我们不会期望在所检验的任何脑图谱的年龄范围内应力差异发生变化。

解决问题3的方法:网络属性(如网络内连接性)是否在不同脑图谱间被可靠地测量?

       在发育和临床研究中,网络功能属性的主要衡量指标之一是网络内功能连接性(Alarcón 等,2018;Jalbrzikowski 等,2019;Lopez 等,2019;Satterthwaite 等,2013;Sylvester 等,2018;Fan 等,2019;Lydon-Staley 等,2019;Reggente 等,2018;Yu 等,2019)。因此,我们考察了这些脑图谱方案是否在四个感兴趣网络(突显网络SN、控制网络CN、默认网络DN和背侧注意网络DaN)内生成了可靠的功能连接性测量。为了计算网络内功能连接性,我们计算了给定网络内所有同源配对(同一半球内的区域)脑区之间的Fisher的z转换后的皮尔逊相关系数,并取其平均值。仅使用同源相关性来计算平均功能连接性,以避免由于跨半球内侧结构(如后扣带皮层)之间的高相关性驱动的估计值膨胀(Ciric 等,2017)。通过平均每个网络内所有同源配对的相关性,我们能够为每个受试者的每种脑图谱方案中的四个感兴趣网络获得一个平均功能连接性的单一测量值。

    我们使用混合效应模型来评估网络内功能连接性的平均水平是否在八种脑图谱方案之间存在显著差异。我们估计了四个模型,每个模型对应四个感兴趣网络中的一个,以平均网络功能连接性作为因变量,脑图谱方案作为自变量,观测值嵌套在受试者内(见下文R模型语法)。

     我们还进行了排除未能恢复所关注网络的脑图谱方案的模型分析(即未通过上述假设1的脑图谱),以确认这些脑图谱方案不会驱动结果。此外,我们还考察了脑图谱特征(如网络内节点数量、脑图谱覆盖的表面积以及数据质量(即运动))是否影响连接性评分。有关这些分析的更多细节,请参见补充材料。

      随后,我们考察了受试者在不同脑图谱方案下保持其网络内连接性排名顺序的程度(即考察网络连接性评分在不同脑图谱间的一致性)。为了评估不同脑图谱间的一致性,我们使用psych包版本2.0.9(Revelle,2020)基于单一评定者/测量、一致性、双向混合效应模型(Koo 和 Li,2016),计算了每个感兴趣网络的脑图谱间网络内连接性的类内相关系数(ICC)估计值。具体而言,我们从Psych ICC函数输出中提取了均方误差(MSE)和均方行(MSR),并使用以下模型计算了ICC(Koo 和 Li,2016):

     鉴于NeuroSynth在上述分析中的表现不佳,以及NeuroSynth的功能连接性估计与其他脑图谱之间缺乏相关性,NeuroSynth脑图谱也被排除在此次分析之外。我们使用boot包版本1.3.25(Canty和Ripley,2020)对ICC估计进行了自助法重抽样,以便计算95%的置信区间(百分位方法)。请注意,在自助法重抽样过程中,使用相同的5000个样本来计算每个网络的一致性估计。此外,为了检验某一特定网络在不同脑图谱中的可靠性是否高于其他网络,我们计算了每对网络一致性(ICC)估计之间的差异(SaN-CN、SaN-DN、SaN-DaN、CN-DN、CN-DaN、DN-DaN);例如,SaN ICC(0.70) – DN ICC(0.50)= 差异0.2。这使我们能够检验例如突显网络是否比控制网络或默认网络产生更可靠的功能连接性估计。通过从所有可能的网络配对(SaN-CN、SaN-DN、SaN-DaN、CN-DN、CN-DaN、DN-DaN)中减去每个网络的自助法重抽样ICC(5000个样本),我们计算了网络间ICC差异的95%置信区间。

解决问题4的方法:所选择的脑图谱是否影响网络属性(如网络内连接性)个体差异的结果?

     在使用脑图谱方案的发育和临床研究中,一个主要关注点是考察网络连接性在个体差异上的表现,作为感兴趣变量(如年龄(Baum等,2020;Jalbrzikowski等,2019;Lopez等,2019)、心理健康问题的存在(Franzmeier等,2019;Kebets等,2019;Fatt等,2020;Yerys等,2019)、环境经验—如贫困(Tooley等,2020;Chan等,2018),或与特定认知能力相关,如智力或执行功能(Reineberg和Banich,2016;Finc等,2020;Murphy等,2020;Alarcón等,2018))。研究通常依赖单一的脑图谱方案来估计功能连接性,只有少数例外(Finc等,2020;Tooley等,2020;Xia等,2018;Shafiei等,2019)。鉴于很少有研究在使用其他脑图谱时检验结果是否可重复,因此脑图谱可互换并产生等效结果的假设尚未经过实证评估。

     为此,我们考察了脑图谱选择在三个不同假设结果中的影响,这些假设与功能连接性个体差异研究中常见的问题相对应。首先,我们检验了功能连接性与年龄之间的关联是否随脑图谱选择而变化(在样本2中,该样本的年龄范围广泛,为3-21岁)。我们考察了所有四个感兴趣网络的年龄效应。我们在三个混合效应模型之间进行了模型比较(观测值嵌套在受试者内),这些模型考察了网络内连接性(因变量)与年龄(自变量)之间的关联。在第一个模型中,没有包含脑图谱的项。在第二个模型中,添加了脑图谱的项,最后在第三个模型中,还添加了年龄与脑图谱的交互项。然后,我们进行了似然比检验,以检验包含脑图谱交互项的模型是否拟合更好。如果脑图谱选择不影响给定假设的结果,那么不包含脑图谱交互项的模型应与包含交互项的模型拟合效果相当(见下文R模型语法)。


      其次,我们检验了网络连接性与生活在贫困线以下家庭之间的关联是否随脑图谱选择而变化(仅在样本1中,因为样本2未包含估算贫困状况所需的家庭规模测量)。贫困被定义为家庭收入低于该家庭规模的贫困线,基于研究进行年份的普查标准。我们估计了与上述年龄效应类似的混合效应模型比较,但将贫困作为自变量,默认网络连接性作为因变量。最后,我们还检验了控制网络连接性与执行功能(抑制)之间的关联是否随脑图谱选择而变化(在样本1中)。抑制通过标准化任务——NEPSY-II中的箭头抑制任务(Brooks等,2009)测量,该任务评估自动反应的抑制。参与者观看多行指向上或下的黑白箭头。在基线试验中,参与者被要求说出每个箭头指向的方向。在抑制试验中,参与者被要求说出每个箭头指向的相反方向。完成基线试验所需的时间从完成抑制试验所需的时间中减去。较大的潜伏期表示较差的抑制控制我们进行了与上述年龄和贫困类似的混合效应模型比较,但将抑制作为自变量,控制网络连接性作为因变量。

3. 结果

结果 – 问题1:脑图谱是否同样能够恢复所关注的网络?

     我们使用多维尺度分析技术来评估在评估的八种脑图谱中,所关注的网络在提取的数据中得到了多大程度的恢复。

      图4A 展示了样本1中每种脑图谱的约束和无约束MDS解决方案的应力值,这清晰地显示了每种脑图谱在两种模型之间的应力变化。图4B所示,样本1中八种脑图谱的平均应力差异(约束MDS解决方案应力值 – 无约束MDS解决方案应力值)在统计上显著不同(F(7, 847)=230.14, p < 0.001)。NeuroSynth图谱表现出最高的总体应力差异,表明这种时间序列提取方法最不能够重建所关注的网络。其他七种脑图谱的应力差异值与NeuroSynth相比要更为相似,然而当NeuroSynth被排除在分析之外时,其余七种脑图谱的应力差异仍然显著不同(F(6, 726)=4.26, p < 0.001)。鉴于无约束应力值总是小于约束MDS应力值,我们没有测试每种脑图谱的应力差异是否不同于零(即单样本t检验)。在样本2中也观察到了类似的结果(图4C图4D)。八种脑图谱之间的应力差异显著不同(F(7, 2303)=544.41, p < 0.001),NeuroSynth相对于其他七种脑图谱表现出显著更大的应力差异。同样,当NeuroSynth被排除在分析之外时,结果仍然显著(F(6, 1974)=21.6, p < 0.0001)。

图4. A:样本1中每种脑图谱的无约束(浅灰色)和约束(深灰色)MDS解决方案的应力值。应力差异(无约束与约束MDS之间)由虚线绿松石线表示。

B:样本1中每种脑图谱的应力差异(约束应力减去无约束应力)。

C:样本2中每种脑图谱的无约束(浅灰色)和约束(深灰色)MDS解决方案的应力值。应力差异(无约束与约束MDS之间)由虚线绿松石线表示。

D:样本2中每种脑图谱的应力差异(约束应力减去无约束应力)。

      我们在使用额外的模块化差异方法时(见补充图S2)发现了与上述无约束与约束MDS应力差异方法一致的结果,即脑图谱显示出显著不同的模块化差异(F(7, 843)=652, p < 0.001)。具体而言,NeuroSynth图谱表现出最高的总体模块化差异,确认了这种时间序列提取方法最不能够重建所关注的网络。与MDS方法类似,其他七种脑图谱的模块化差异值更加相似。

结果 – 问题2:这些源自成人的脑图谱是否能够很好地代表儿童大脑中的网络?

       为了评估在成人中开发的脑图谱方案中识别的功能网络是否在儿童数据中得到了良好的表示,我们检验了应力差异(即提取数据重现网络的程度)是否随年龄变化而变化。如果应力差异随着年龄的增加而减少,这将表明所关注的网络在儿童数据中比成人数据中更难以识别。样本1的结果表明,应力差异与年龄的关联因脑图谱而异(χ²[7] = 22.2, p = 0.0023, ΔAIC = −8.3)(图5A)。这一总体结果主要由NeuroSynth脑图谱驱动,NeuroSynth脑图谱相对于总体均值显示了随着年龄增加的显著应力差异增加(b = 0.0034, t(840) = 3.662, p = 0.00026)。鉴于NeuroSynth在网络重现方面表现不佳(图4D)且显示了显著不同的年龄效应,我们在排除NeuroSynth后重新进行了分析。当我们重复上述模型比较时,年龄与脑图谱的交互作用不再显著(χ²[6] = 11.6, p = 0.072, ΔAIC = 0.4)。此外,包含年龄主效应的模型与不包含年龄的模型拟合效果没有显著差异(χ²[1] = 1.9, p = 0.17, ΔAIC = 0.1)。在样本2中也观察到了类似的结果,包含年龄主效应的模型与不包含年龄的模型拟合效果没有显著差异(χ²[1] = 9.6, p = 0.21, ΔAIC = 5)(图5B)。这表明,排除NeuroSynth后,源自成人数据的脑图谱中的功能网络在儿科数据中得到了同样的表示。

图5. A:样本1中按年龄和脑图谱分类的应力差异。B:样本2中按年龄和脑图谱分类的应力差异。除NeuroSynth外,任一样本中应力差异均未随年龄显著变化。

结果 – 问题3:网络属性(如网络内连接性)是否在不同脑图谱间被可靠地测量?

      在评估的四个网络中,网络内功能连接性的测量因脑图谱而显著不同:突显网络(F(7, 850) = 76, p < 0.0001)、控制网络(F(7, 850) = 93, p < 0.0001)、背侧注意网络(F(7, 850) = 92, p < 0.001)和默认网络(F(7, 850) = 330, p < 0.0001)。如图6A所示,突显网络在八种脑图谱中表现出最小的网络内连接性变异性,其次是控制网络(图6B)。默认网络(图6C)和背侧注意网络(图6D)表现出高度可变的网络内连接性,其中NeuroSynth产生了最低的评分,而Yeo等人(2011)产生了最高的评分。所有这些结果在样本2中也保持一致,突显网络(F(7, 2300) = 360, p < 0.0001)、控制网络(F(7, 2300) = 390, p < 0.0001)、默认网络(F(7, 2300) = 720, p < 0.0001)和背侧注意网络(F(7, 2300) = 340, p < 0.001)在评估的八种脑图谱中平均功能连接性均显示出显著差异。类似的连接性测量变异模式也在脑图谱之间观察到,默认网络和背侧注意网络表现出最多的变异性,其次是控制网络,最后是突显网络。当NeuroSynth被排除在分析之外时,样本1和样本2中的结果模式相同(所有比较均 p < 0.0001)。我们进行了额外的分析,以检验脑图谱特征(如网络内节点数量,即脑区数量)、脑图谱覆盖的表面积或数据质量(即运动)是否影响网络内连接性估计。有关这些分析的详细讨论见补充材料。简而言之,功能连接性与网络内节点数量呈负相关,b = −0.00149, t(28.8) = −2.12, p = 0.0424(见图S3A),并且随脑图谱表面积覆盖的增加显著变化,F(3300) = 110, p < 0.0001(见图S3B)。相比之下,帧间位移——一种数据质量指标——与功能连接性无关联,b = −0.0817, t(120) = −0.993, p = 0.323(见图S3C)。

图6. 每个感兴趣网络在不同脑图谱中的平均功能连接性测量。所有评估的网络(包括A) 突显网络、B) 控制网络、C) 默认网络和D) 背侧注意网络)在八种脑图谱中的连接性均显著不同,样本1(深色)和样本2(浅色)均如此。灰色虚线表示每个网络在样本1中的总体平均连接性。

      我们还考察了各脑图谱方案是否产生了可靠的网络内连接性测量,这意味着受试者在特定网络内的功能连接性排名在不同脑图谱方案之间保持一致。为了考察脑图谱派生的连接性评分的内部一致性,我们为每个感兴趣网络计算了一致性(ICC)测量值。请注意,鉴于NeuroSynth在上述分析中的表现不佳,NeuroSynth被排除在此次评估之外。如图7A所示,突显网络产生了最可靠的评分,ICC为0.70,表明脑图谱之间具有中等一致性(Koo和Li,2016)。如图7C所示,突显网络内的功能连接性估计在脑图谱之间显著更稳定,比其他三个网络(SaN-CN: 95% CI [0.00990 0.159];SaN-DN: 95% CI [0.117 0.298];SaN-DaN: 95% CI [0.139 0.335])。控制网络在脑图谱之间的一致性显著高于默认网络(CN-DN: 95% CI [0.0358 0.212])和背侧注意网络(CN-DaN: 95% CI [0.0432 0.261])。然而,控制网络的ICC为0.62,仍显示出相对较差的一致性。默认网络(ICC=0.5)和背侧注意网络(ICC=0.47)产生了更低的网络内功能连接性一致性估计,这两者之间没有显著差异(DN-DaN: 95% CI [−0.0823 0.140])。图7A 还显示了各脑图谱方案之间的网络内连接性值的相关矩阵。

图7.样本1中每个感兴趣网络(突显、控制、默认、背侧注意)在脑图谱之间的功能连接性一致性。NeuroSynth因其在前述分析中的表现不佳而被排除在此次评估之外。
A: 每个感兴趣网络按脑图谱的功能连接性相关矩阵。
B: 每个感兴趣网络(在所考察的脑图谱之间)的连通性一致性估计及自助法置信区间。
C: 网络间连接性一致性差异评分,展示某些网络在脑图谱之间显示出更一致的连接性评分(突显网络和控制网络)。

      在样本2中也发现了类似的结果,突显网络被发现是最可靠的(ICC=0.69),其次是控制网络(ICC=0.62)、默认网络(ICC=0.5)和背侧注意网络(ICC=0.32)(图8)。样本2中唯一的差异是默认网络比背侧注意网络显著更可靠(DN-DaN: 95% CI [0.103 0.258])。

图8. 样本2中每个感兴趣网络(突显、控制、默认、背侧注意)在所考察的脑图谱之间的功能连接性一致性。
A: 每个感兴趣网络按脑图谱的功能连接性相关矩阵。
B: 每个感兴趣网络(在所考察的脑图谱之间)的连通性一致性估计及自助法置信区间。
C: 网络间一致性差异评分。

结果 – 问题4:所选择的脑图谱是否影响网络属性(如网络内连接性)个体差异的结果?

      最后,我们还评估了脑图谱选择在解释关于功能连接性个体差异(如年龄、贫困和认知功能)假设性结果中的影响。具体而言,我们检验了网络连接性与年龄(样本2)、贫困(样本1)和执行功能(样本1)之间的关联是否因脑图谱选择而显著变化。我们使用八种脑图谱方案分别检验了这些关联,发现对于所评估的每一种关系,效果都因脑图谱选择而显著不同。

      所考察的八种脑图谱方案在网络连接性与年龄之间的关联上产生了不同的结果(图9A)。我们发现,包含年龄与脑图谱交互项的模型在四个感兴趣网络中的三个(突显网络SaN、控制网络CN和默认网络DN)拟合效果更好,表明这些网络的连接性与年龄的关联显著因脑图谱选择而异。对于突显网络、控制网络和默认网络,包含年龄与脑图谱交互项的模型比不包含交互项的模型拟合效果显著更好(SaN: χ²[7] = 84.7, p < 0.0001, ΔAIC = 70.7;CN: χ²[7] = 27.2, p < 0.001, ΔAIC = 13.2;DN: χ²[7] = 24.9, p < 0.001, ΔAIC = 10.9)。相比之下,当添加年龄与脑图谱交互项时,背侧注意网络的模型拟合效果并未改善(DaN: χ²[7] = 7.7, p = 0.360, ΔAIC = −6.3)。这些发现表明,三个网络(突显网络、控制网络和默认网络)的网络连接性与年龄的关联在脑图谱选择上存在显著差异。我们对所考察的八种脑图谱方案中的每一种进行了后续的简单斜率分析,以评估这些关联是否存在可识别的模式(Aiken等,1991)。如图9A所示(并在图9B图9C中对默认网络进行了更详细的说明),在哪些脑图谱产生显著关联方面,没有一致的模式。此后续的简单斜率分析还展示了如果八位独立研究人员各自选择其中一种脑图谱并使用当前领域中普遍接受的方法(即使用单一脑图谱方案而不测试效果对脑图谱选择的鲁棒性)进行单一假设检验(即年龄与功能连接性之间的关联),会发生什么情况。如图9所示,当以这种方式使用时,不同脑图谱的使用会导致关于年龄与功能连接性关联的不同结论。

图9. 评估年龄与功能连接性关联随脑图谱选择变化的情况(样本2)。

A: 模型比较结果,评估是否添加年龄与脑图谱交互项使模型拟合效果优于不包含交互项的模型,针对每个感兴趣网络。突显网络、控制网络和默认网络的网络连接性与年龄的关联随脑图谱选择显著变化,而背侧注意网络则没有。对于具有显著年龄与脑图谱交互的网络,我们提供了每种脑图谱方案下年龄与功能连接性关联的beta估计值和p值。图9B图9C 提供了默认网络关联的更详细说明。

B: 图示了每种脑图谱方案下年龄与默认网络连接性关联的点估计值和置信区间的显著差异。结果表明,如果独立研究人员选择Glasser、NeuroSynth或Yeo脑图谱中的任一一种,而不是其他五种脑图谱之一,将会得到显著结果。

C: 展示了每种脑图谱方案下年龄与默认网络连接性关联的图示。

      功能连接性与贫困之间的关联也在默认网络中因脑图谱选择而显著不同图10),但在其他三个网络中没有显著的交互或主效应。检验默认网络连接性与贫困之间关联的模型,包含脑图谱与贫困的交互项,拟合效果显著优于不包含该交互项的模型(χ²[7] = 30.6, p < 0.001, ΔAIC = 16.6)。如图10B所示,后续的简单斜率分析显示,三种脑图谱方案中观察到贫困与默认网络连接性之间存在显著的负相关,而五种脑图谱方案中没有关联。虽然这可能是由于不同脑图谱的一致性程度和统计功效不同所致,但在这种情况下,我们会期望看到置信区间的变化,而不是点估计值的变化。然而,如图10A所示,点估计值及其置信区间均存在显著的变异。

图10. 在样本1中,考察贫困与默认网络连接性的关联如何随脑图谱分割变化。
A:在所考察的每种脑图谱分割下,贫困与默认连接性关联的点估计值。点估计值及其置信区间存在显著变异。
B:不同脑图谱分割下,贫困与默认连接性之间的特定关联。如果独立研究人员选择Gordon、Yeo或Schaefer 400中的任一一种脑图谱,将会获得显著结果,但其他五种脑图谱则不会。

      最后,所考察的八种脑图谱方案在控制网络连接性与抑制控制任务表现之间的关联上也产生了不同的结果(图11A)。包含脑图谱与抑制表现交互项的模型拟合效果显著优于不包含该交互项的模型(χ²[7] = 32.1, p < 0.001, ΔAIC = 18.1)。简单斜率分析显示,使用任意三种Schaefer脑图谱方案时会得到显著结果,而使用其他五种脑图谱方案则不会得到显著结果。与上述两项分析类似,beta估计值及其置信区间存在显著变异。

图11. 考察执行功能(抑制控制任务表现)与控制网络连接性的关联如何随脑图谱分割变化(样本1)。
A:每种脑图谱分割下,抑制与控制连接性关联的beta估计值及其置信区间。beta估计值及其置信区间存在显著变异。
B:不同脑图谱分割下,抑制与控制连接性之间的特定关联。如果独立研究人员选择任何一种Schaefer脑图谱方案,将会获得显著结果,而其他五种脑图谱方案则不会得到显著结果。

4. 讨论

      在本研究中,我们检验了应用脑区分割方案以识别静息态功能网络时所做的四个主要假设。我们发现,除NeuroSynth外,各种脑区分割方案中识别的主要网络在提取的数据中得到了同等程度的表示。此外,尽管使用了源自成人的脑区分割方案进行网络识别,我们发现所关注的网络在儿童的数据中也得到了良好的表示。然而,各种脑区分割方案未能产生可靠的网络内功能连接性测量,且脑区分割的选择对检验个体差异(如年龄、贫困和认知功能)与功能连接性之间关系的假设测试结果产生了显著影响。

网络重现

      除NeuroSynth派生图谱外,其他七种脑区分割方案在重现脑区分割提取的静息态功能连接性数据中的所关注网络方面表现相似。这表明,作为先验方案应用时,各种脑区分割方案能够捕捉到网络层面的功能性脑组织。NeuroSynth在方法论上明显不同于其他七种方案,因为它依赖于通过关键词在认知神经科学工作中识别的基于任务的活动的元分析综合(Yarkoni等,2011)。尽管使用NeuroSynth图谱来识别主要功能网络的做法不太常见,我们仍有兴趣检验基于任务的活动的元分析模式(即“默认网络”)在与使用静息态数据派生的脑区分割方案相比时,实际是否能保持一致。正如我们的发现所示,使用NeuroSynth派生的静息态网络图谱未能重现所关注的网络。这表明,尽管研究人员标记或讨论特定的基于任务的活动模式为如今规范性的功能网络,但在静息态中识别的网络与基于任务分析中观察到的活动模式之间存在明显的分离。尽管任务可能会招募位于规范性功能网络内的区域,任务需求也可能导致激活其他可能不属于同一功能网络的区域。NeuroSynth未能重现所关注的网络,质疑了任务中观察到的活动模式与使用基于连接的脑区分割方法派生的网络之间的重叠。这些发现进一步要求在将基于任务的活动模式标记为规范性功能网络时,必须给予仔细关注。已有工作试图在低级任务(如手指敲击,Gordon等,2016, 2017; Laumann等,2015)中识别基于任务的活动与功能连接性之间的重叠,近期工作已将这些发现扩展到似乎在各种复杂功能中被优先招募的高级皮层网络(Braga等,2020; DiNicola等,2020)。然而,需要注意的是,用于评估网络招募的任务是专门设计来区分网络功能的。具有更复杂需求的任务,未被设计来有意区分网络功能,可能会导致不那么清晰的优先网络招募。这表明,在对广泛认知能力进行测试的任务中做出关于网络招募的结论时,必须非常谨慎,而不是使用旨在引发网络特定招募的紧密设计任务。在探索复杂认知任务中皮层关联网络的招募方面,还有许多工作要做。

在发育样本中使用源自成人的脑区分割方案

      在发育样本中应用源自成人的脑区分割方案假设这些分割方案能够代表儿童的主要功能网络。通过检验网络重现程度是否随年龄和脑区分割变化,我们能够评估在发育样本中使用这些分割方案的有效性。除NeuroSynth外,脑区分割方案在两个样本中均未显示出应力差异随年龄的显著变化,包括一个年龄范围广泛(3-21岁)的样本。这些发现表明,源自成人数据的脑区分割方案中所关注的网络在儿童的静息态数据中得到了同等程度的表示。这些发现对理解功能网络的发展具有明确的方法学和概念意义。如果网络重现程度随年龄显著变化,这将表明源自成人的脑区分割方案中定义的主要网络边界并不适用于儿童的网络。这种发现将表明功能网络在发育过程中在空间布局和范围上发生了剧烈变化。然而,我们发现情况并非如此,这表明在发育早期,成人观察到的功能网络已经基本建立,并与成人中观察到的网络密切相似。

      尽管我们的发现显示源自成人的脑区分割方案总体上反映了儿童大脑中的网络,但我们的工作受限于使用刚性的群体派生脑区分割方案来定义网络。最近的发育研究发现,功能网络在发育过程中确实表现出微妙但有意义的拓扑变化(Cui等,2020)。我们的工作目标是检验源自成人的脑区分割方案是否能够捕捉到儿童中的一般网络结构,结果发现大体如此。然而,我们可能错过了可能在理解功能网络随发育变化中具有意义的细微变化。此外,应用脑区分割方案假设网络的拓扑在所有个体中完全相同。最近在密集采样的成人中进行的精密神经科学工作开始通过派生个体特定的脑区分割方案来检验主要功能网络(Braga等,2019; Braga和Buckner,2017; Gordon等,2017; Gratton等,2018; Kraus等,2021; Laumann等,2015),并发现关联网络的拓扑在个体之间高度独特(Hill等,2010a; Laumann等,2015; Kong等,2019)。依赖群体平均的脑区分割方案,我们错过了考察这种独特的网络组织和拓扑如何出现以及环境经验和其他因素如何塑造这一发展的机会。简而言之,尽管我们未发现网络结构随发育显著变化,表明源自成人的脑区分割方案能够捕捉儿童的一般网络结构,但通过摆脱刚性地使用先验脑区分割方案来定义这些网络,仍有很大收获。

基于脑区分割提取数据的网络特定测量的一致性

      尽管各种脑区分割方案在重现所关注网络方面表现相似,但网络内功能连接性的测量在脑区分割之间存在显著差异,尤其是默认网络和背侧注意网络。几个脑区分割特征影响了功能连接性估计,包括节点数量和大脑皮层覆盖程度。此外,网络内连接性估计在脑区分割之间的一致性中等到较差。这意味着,在一种脑区分割方案中,相对于样本中的其他个体,具有相对较高功能连接性的参与者在另一种脑区分割方案中不一定在同一网络中也具有高连接性。这一发现令人担忧,因为它表明脑区分割的选择会显著影响功能连接性的估计。

      突显网络在各种脑区分割方案中被标记得最不一致,但产生了最可靠的连接性估计,其次是控制网络。默认网络和背侧注意网络显示出最低的一致性。默认网络和背侧注意网络内部一致性的缺乏主要是由于Glasser脑区分割(Glasser等,2016)所得到的连接性估计具有反相关/不相关的特性,这与其他仅使用静息态功能磁共振成像(rsfMRI)派生的脑区分割方案不同。这表明,Glasser脑区分割中识别的“默认”网络和“背侧注意”网络不应被视为与其他所考察脑区分割方案中同标签网络的同义词。这些发现提示,在选择脑区分割方案以及使用特定研究结果得出关于“规范”功能网络的一般结论时,应当谨慎。虽然在使用各种方法学方法开发的脑区分割方案中,所识别网络的一般范围似乎存在一定的一致性,但我们的结果表明,每种脑区分割方案中定义的网络范围的差异可能对从脑区分割提取的数据中得到的连接性测量产生显著影响。此外,这些发现提示在跨不同脑区分割方案识别网络时,绘制平行关系需要谨慎,这表明从当前的脑区分割实践中尚未建立大脑组织的“真实情况”。

     所使用的脑区分割方案的一个主要限制是它们源自群体平均数据。最近在密集采样个体中的研究表明,许多在群体平均数据中识别的功能网络由不同但高度交织的网络组成,这些网络支持不同的功能能力(Braga等,2019; Braga和Buckner,2017; DiNicola等,2020)。这些发现对群体平均数据在未来功能性脑组织研究中的实用性提出了重要问题,并表明研究个体差异性组织的研究可能更适合放弃先验脑区分割的应用,转而使用个体水平的脑区分割方案。尽管这种方法需要每个个体更多的数据,但从这些方法中获得的知识可能具有启发性。

脑区分割选择对结果的影响

      在发育和临床研究中,通常只使用单一的脑区分割方案进行分析。这假设脑区分割的选择不会影响结果的解释。我们的发现挑战了这一假设。针对年龄、贫困和认知功能的功能连接性差异进行的一系列分析显示,脑图谱的选择对结果的解释产生了显著且有意义的影响。在每一种所检验的关联中,大约有三种脑区分割方案产生了显著结果,而其他五种则产生了无效结果。此外,我们不仅在估计的统计显著性上观察到了显著的变异,在点估计值上也观察到了显著的变异。这些发现表明,脑区分割的选择可能对研究静息态功能连接性个体差异的研究结果产生显著影响,尤其是当仅使用单一脑区分割方案时。因此,我们建议研究人员除非有强烈的理论理由,否则不要依赖于单一的脑区分割方案进行分析。此外,我们建议采用一系列脑区分割方案,甚至可能进行规范曲线分析(Del Giudice和Gangestad,2021; Simonsohn等,2015)以确认结果的稳健性。有一些分析管道,例如XCP管道(Ciric等,2018),构建为与fmriPREP(Esteban等,2019)输出和脑成像数据规范(Brain Imaging Data Specification,Gorgolewski等,2016)兼容,能够通过自动提供从多个脑区分割方案提取的时间序列输出选项,使得这样的重复研究成为可能。通过进行这样的重复研究,研究人员可以确信他们的结果不依赖于脑区分割的选择。

      此外,诸如青少年大脑与认知发展(ABCD)研究(Casey等,2018)等大规模基于人群的样本提供了一个机会,不仅可以研究网络连接性的发育和个体差异,还可以评估脑区分割选择对非常大样本中结果的影响,并确认结果对脑区分割选择的稳健性。然而,ABCD研究目前仅在其表格数据中提供了使用Gordon 2016脑区分割提取的静息态时间序列数据。因此,个别研究人员不易额外检验脑区分割选择对其发现的影响。ABCD研究仅发布了从单一脑区分割方案提取的数据,这清楚地表明该领域的假设是脑区分割的选择不会显著影响结果。鉴于我们的发现,脑区分割的选择确实可能/确实会影响结果,我们建议未来ABCD静息态数据的发布应包括从其他脑区分割方案提取的数据。

5. 结论

      我们检验了在使用先验脑区分割方案识别规范性功能网络并检验功能连接性个体差异时所做的一系列假设。我们发现,除NeuroSynth外,所关注的网络在使用八种脑区分割方案提取的数据中得到了同等程度的恢复。此外,所关注的网络在儿童数据中与成人数据中一样得到了良好的表示。然而,网络内功能连接性在所考察的四个网络的脑区分割方案中表现出显著的变异性和较差的一致性。此外,脑区分割的选择对功能连接性与年龄、贫困和认知功能之间关联的大小和显著性产生了有意义的影响。我们的发现表明,依赖于先验脑区分割方案进行网络识别的研究可能受益于使用多种方案以确认结果的稳健性和普遍性。此外,旨在深入了解功能网络的研究人员可能会受益于采用更细致的网络识别方法,例如使用密集采样的个体数据来生成个体派生的网络脑区分割方案。确实,最近的研究考察了特异性网络拓扑,而非网络内连接性,已经展示了与认知和行为相关的有意义的个体差异拓扑(Bijsterbosch等,2018; Kong等,2019)。向精准神经科学过渡,不论是在认知工作中还是在发育和临床工作中,可能会改善功能性脑组织的表征及其与认知和行为的联系,这在方法仅限于群体平均方法时是无法实现的。