导语

ONE

PDAC 中预后缺氧和乳化相关基因及其遗传变异的鉴定
在本研究中,使用 TCGA 和 GETx 数据库中 PDAC 患者的基因转录谱组合来识别 PDAC 中的差异表达基因 (DEG)。利用 R 包 “limma” ( 3.58.1 ) (log2 (FC)| > 1.5, p < 0.05),作者总共获得了 2333 个差异表达基因 (DEGs)。根据乳酰化修饰与糖酵解、乳酸代谢和缺氧密切相关的认识,作者在 GSEA 数据库中确定了 764 个乳酰化相关途径和 87 个缺氧相关基因集,并提取了 1 个缺氧和乳酸化相关基因 (HALRGs)。通过采用 DEGs 与缺氧和乳酰化相关基因的交集,作者获得了 183795 个差异表达的缺氧和乳酰化相关基因。稍后在 TCGA 和 GSE1 联合 mRNA 表达队列中进行单变量 Cox 回归分析,以确定 31 个预后缺氧和乳酸化相关基因,并根据上述单变量 Cox 回归分析的结果绘制森林图。共有 1 个预后 HALRGs 显示出显着的预后能力,PLOD1 、 LDHA 、 PIGA 和 CENPA 的 Kaplan-Meier 生存曲线如图所示。

在 173 个肿瘤样本的数据集中,这 31 个预后基因以 4.05% 的频率发生突变,其中 P4HA1 的突变率最高。TIMM50 的拷贝数增加频率最高,而 ERRFI1 的 CNV 丢失最显著。为了研究用于基因优先排序和预测这些预后基因基因功能的生物网络整合,本研究使用了 GeneMANIA 预测服务器(http://www.,3 年 2024 月 19 日访问)[1]。在圆圈图中,内圈中的基因是与预后相关的基因,外圈基因是集合预测的基因在功能上相似或与初始预后基因具有共同特性的基因。这些基因之间的相互作用和功能如图所示。

TWO

预后 HALRG 的泛癌分析
由于作者已经确定了 31 个 HALARGs 在 PDAC 患者中的预后价值,为了加深作者对这些预后基因的生物学功能和临床价值的理解,作者使用基因集癌症分析 (GSCA) 进行了泛癌分析。作者的目标是通过泛癌分析确定这些基因在肿瘤发展中的共性和特异性,从而提高作者研究的广泛适用性和普遍性。首先,GSCA 根据 31 个基因估计 GSVA 评分与 33 种癌症类型的生存率(包括 OS、PFS、DSS 和 DFI)之间的关联。在图中可以观察到多种癌症类型的低和高 GSVA 评分组之间的显着生存差异,包括一些常见的癌症类型,如肺腺癌 (LUAD)、膀胱尿路上皮癌 (BLCA)、肾透明细胞癌 (KIRC)、间皮瘤 (MESO)、头颈部鳞状细胞癌 (HNSC) 等,尤其是在胰腺癌患者中。气泡图直观地显示了这些差异,表明 GSVA 评分较高的组预后较差。这些结果验证了作者之前从单变量 Cox 回归分析中获得的结果,并表明有必要研究这些基因在 PDAC 患者中的生物学价值。为了进一步分析其背后的生物学机制,作者研究了 GSVA 评分与泛癌中癌症相关通路活性之间的关联。作者发现细胞周期通路和细胞凋亡通路在大多数癌症中被激活,包括 LUAD、LIHC、HNSC、COAD、STAD 等。有趣的是,作者发现 EMT 通路在胰腺癌中被激活,表明这些预后基因表达水平较高的患者可能经历更高的肿瘤进展和转移风险(图 2B)。随后,作者检查了预后基因表达和通路活性组的差异,即激活和抑制,根据中位通路评分分类。热图说明了 33 种癌症类型的癌症百分比,其中基因对特定通路有显着影响 (FDR ≤ 0.05)。基于热图分析,作者假设几个预后基因的 mRNA 表达水平可能会激活各种癌症类型的细胞周期、EMT 和细胞凋亡途径(图 S1D)。

接下来,作者使用 GSCA 分析泛癌中 GDSC 和 CTRP 药物 (前 30 名) 预后基因表达与敏感性之间的相关性 (图 2C、D)。气泡图显示,SLC2A1 、 PLOD1 、 PKP2 、 ERRFI1 、 ALDH1B1 和 TIPARP 的 mRNA 表达水平与多种 GDSC 药物的敏感性呈正相关。虽然它们与一些 GDSC 药物的敏感性具有天然相关性,包括曲美替尼,一种常用的腹部肿瘤化疗药物,但同时,PPIA 、 SLC25A42、 KDM3A、CHEK2 和 NUP98 的 mRNA 表达水平具有相反的结果。

THREE

无监督聚类分析确定了两种预后相关的 HALRAGs 相关亚型
基于 31 个 HALRGs 的基因表达,作者进行了共识聚类分析以对 PDAC 样本 (TCGA 和 GSE183795 联合表达队列,n = 318)。如图 3A 所示,作者成功地将所有 PDAC 样本分成两个不同的聚类,最佳聚类变量为 2。结果后来被 PCA 确认(图 3B)。作者采用 “survival” R package (version 3.5.7) 进行生存分析并评估两种亚型的总生存期 (OS) 时间。结果表明,与集群 A 相比,集群 B 表现出更好的预后(图 3C)。此外,作者使用 “limma” R 包 (版本 3.58.1) 提取了两种亚型之间的差异表达基因以进行进一步分析 (log2 (FC)| > 1.5, p < 0.05)。

FOUR

两种亚型之间的生物学功能差异
为了研究两种缺氧和乳酰化相关亚型之间的潜在生物活性,作者采用 PROGENy (用于活性推断的 Pathway RespOnsive GENes) 来评估两种亚型中细胞信号通路的激活水平。作者的研究结果表明多种细胞信号通路的差异激活,包括 EGFR、缺氧、JAK-STAT、MAPK、NF-κB、P53、PI3K 和 VEGF 等(图 3D)。A 组表现出致癌途径的显著激活,包括 EGFR、MAPK、TGF-β、P53、VEGF、WNT 和缺氧。这一结果激发了作者进一步研究这两个集群的生物学差异。这两种亚型的其他现有变异可能为它们不同的预后结局提供新的见解。

接下来,作者对两个簇之间的差异表达基因进行了 GO 和 KEGG 功能富集分析。KEGG 分析显示,DEGs 主要富集于细胞周期、 HIF-1 信号通路、黏着斑和 Hippo 信号通路,表明两组之间肿瘤微环境 (TME) 存在差异 (图 3E)。GO 分析显示,DEGs 与伤口愈合、细胞生长、对缺氧的反应和对氧化应激的反应有关(图 3F)。

FIVE

4+分型+机器学习+单细胞+分子对接,热点顶流“乳酸化”发文思路,请接收!
PDAC 中缺氧和乳化相关预后模型的构建和验证
基于之前的分析,作者承认这些缺氧和乳酰化相关基因作为 PDAC 患者预后指标的重要性,表明基于它们构建预后模型的可行性。作者采用了三种机器学习算法 (LASSO、XGBoost 和随机森林) 来筛选枢纽基因以构建预后模型 (图 S2A)。通过不同机器学习算法识别的基因交集,精心选择了八个基因(LDHA、PIGA、PLOD1、POMT1 和 MPC1),构成了构建后续模型的基础。利用从每个基因的 LASSO 回归分析得出的表达水平和系数,作者计算了每个样本的风险评分(图 4A-C)(风险评分 = βLDHA ×表达LDHA + βPIGA × 表达PIGA + βPLOD1 ×表达PLOD1 + βPOMT1 × 表达POMT1 + βMPC1 ×表达MPC1 + βKDM3A × 表达KDM3A + βSLC25A4 × 表达SLC25A4 + βCENPA ×表达CENPA,β = 每个基因的系数)。根据中位风险评分将训练队列的所有样本分为低风险组和高风险组。生存曲线显示,风险评分较高的组预后较差(图 4G)。在训练队列中,1 、 3 和 5 年的 AUC 值分别为 0.674、0.742 和 0.731,表明风险模型对 PDAC 患者具有潜在的预测能力(图 4H)。另一条 ROC 曲线表明,与其他临床特征相比,风险评分具有最高的 AUC 值(图 4I)。训练队列中 4 个枢纽基因的表达谱显示在热图中(图 4D)。图 E,F 说明了风险评分分布和生存状态的表示。

此外,为了更全面地评估预后模型的可靠性和有效性,作者在随后的分析中使用了 GSE62452、 GSE78299 和 GSE85916 作为三个外部独立测试队列。根据预后模型将所有样本分为低风险组和高危组。同样,生存分析表明,与高危患者相比,低风险患者的总生存期 (OS) 更好(图 5A-C)。GSE1 测试集在 3 年、 5 年和 62452 年的 AUC 值分别为 0.619、0.760 和 0.903(图 5D)。在 GSE78229 测试集中,1 、 3 和 5 年的 AUC 值分别为 0.650、 0.760 和 0.876(图 5E)。在 GSE85916 测试集中,1 、 3 和 5 年的 AUC 值为 0.632、 0.583 和 0.632(图 5F)。<> 个测试集的 ROC 曲线证实了预后模型对 PDAC 患者的一些预后预测价值。

SIX

风险组之间预测列线图和突变的发展
单变量和多变量 Cox 回归分析都说明了与其他临床特征相比,风险评分作为独立预后因素的可靠性(图 5I,J)。随后,作者尝试结合临床参数来构建列线图,这是预测 PDAC 患者 1 年、3 年和 5 年总生存期 (OS) 的宝贵工具(图 5G)。校准曲线如图 5H 所示。接下来,采用瀑布图直观地表示低风险组和高风险组的基因突变。值得注意的是,高危人群表现出更高的突变负担。具体来说,KRAS 和 TP53 的突变频率在高危组中显着升高(图 4I,J)。

SEVEN

特征的免疫学景观和功能分析
根据以前的文献,组蛋白乳酸化和缺氧对肿瘤的代谢重编程有重要影响,从而影响多种癌症类型的免疫治疗反应。作者首先使用多种免疫算法来评估风险评分与免疫细胞丰度之间的相关性(图 6A)。创始人表明风险评分与大多数浸润免疫细胞之间存在负相关,表明风险评分较高的患者可能具有更严重的免疫抑制微环境。此外,作者还研究了特征基因与免疫细胞之间的相关性(图 S2B)。值得注意的是,CENPA 与 M0 巨噬细胞和树突状细胞激活呈强阳性关系。此外,作者从以前的文献中获得了几个免疫逃逸相关基因,以评估它们与风险评分的关联。图 6C 表明作者的预后模型计算的风险评分与大多数免疫逃逸相关基因之间存在很强的正相关关系。所有这些发现都表明,预后模块模型可能作为预测 PDAC 患者免疫治疗反应的宝贵工具。

EIGHT

免疫治疗反应预测和化疗敏感性分析
根据前面的分析,作者确定了风险评分与肿瘤免疫力之间的潜在联系。因此,作者使用肿瘤免疫功能障碍和排除 (TIDE) 算法来探索低风险和高危人群 PDAC 患者的免疫治疗反应。作者的资金表明,两组患者的免疫治疗反应确实存在差异,低风险组对免疫治疗的反应率更高(图 6B)。然后,作者使用 “oncoPredict” R 软件包 (0.2 版) 预测了 TCGA-PAAD 患者的 198 例临床药物反应,分为低风险组和高危组。图 6D 揭示了一项重要发现,其中低风险组患者对多种常用抗肿瘤药物的敏感性增加,包括索拉非尼、奥沙利铂、达拉非尼、伊立替康等。这些发现提供了证据,表明作者的预后模型可能能够作为预测 PDAC 患者化疗药物反应性的有效工具。

NINE

通过 scRNA-Seq 分析测定特征基因的 CERES 评分和特征
为了从所有特征基因中鉴定出最重要的基因,根据之前的研究,计算了 43 个 PDAC 细胞系的 CERES 评分。作者发现 CENPA 基因的得分最低,这意味着该基因可能对 PDAC 细胞发挥更重要的作用(图 7A)。为了全面表征特征基因,作者使用 GSE197177 数据集进行了单细胞分析,该数据集包括 7 个主要 PDAC 样本、7 个肝转移样本和 5 个正常样本。如图 0B、C 所示,使用细胞亚群定义的经典标记对每个亚型的细胞身份进行注释。CENPA 在每种细胞类型中的平均表达水平如图 1C 所示。在原发性胰腺癌单细胞样本中,CENPA 在导管细胞群中高表达,而在正常样本和转移样本中表达水平较低,这意味着 CENPA 可作为胰腺癌的潜在治疗靶点。考虑到作者的预后模型所证明的预测能力,作者试图在单细胞水平上进行更多的研究。首先,作者使用“Seurat”R 包(版本 2.7.7)中的“AddModuleScore”根据特征基因的表达计算原发性和转移性胰腺癌单细胞样本的分数(图 S<>D,E)。为了进一步研究低分组和高分组背后的生物学特征差异,作者探讨了 <> 种注释细胞类型之间的复杂通讯。与高分组相比,低分组显示内皮细胞、成纤维细胞和髓系细胞之间的通讯量增加。此外,在高分组中,内分泌细胞与其他几种细胞类型之间的相互作用数量增加,而 T 细胞和髓系细胞以及腺泡细胞和导管细胞之间的通讯强度减弱(图 <>D、F)。作者还确定了低分组和高分组之间显示显着差异的关键信号通路并确定了优先级。高分组中的细胞激活了大多数与肿瘤发生和进展相关的信号通路,包括 TGF-β、CCL、PTN、FGF、VEGF 和 EGFR(图 <>E)。

TEN

敲低 CENPA 阻碍了 PDAC 细胞的增殖和迁移潜力
PDAC 患者的 TCGA 和 GETx 数据表明,CENPA 在肿瘤样本中高表达(图 8B)。从 HPA 数据库获得的免疫组织化学结果验证了 PDAC 组织中 CENPA 的蛋白质表达水平较高(图 8A)。为了评估 CENPA 的预后价值,作者发现 CENPA 高表达水平的 PDAC 患者往往预后较差(图 8C)。此外,作者验证了 CENPA 在多种 PDAC 细胞系中的 mRNA 表达水平。与 hTERT-HPDE 相比,在 BXPC-3 、 CAPAN-1 、 CAPAN-2 、 CFPAC-1 、 MIA PaCa-2 、 PANC-1 和 SW1990 中发现 CENPA 的表达水平相对较高(图 8D)。为了更深入地研究 CENPA 对胰腺癌生长和迁移的影响,作者开发了具有 CENPA 敲低的 PANC-1 和 MIA Paca-2 细胞系(图 8E)。在进行 CCK-8 测定和克隆形成测定后,作者实验证明 CENPA 的敲除有效阻碍了 PANC-1 和 MIA Paca-2 细胞的生长和增殖(图 8F,G)。为了评估 CENPA 对细胞转移潜力的影响,作者进行了 transwell 迁移和伤口愈合试验。图 8H 显示,与 CENPA NC 细胞相比,CENPA 敲低细胞表现出明显更宽的划痕间隙。同样,transwell 迁移测定显示 CENPA 基因的敲低抑制了 PANC-1 和 MIA Paca-2 细胞的迁移(图 8I)。鉴于上述结果,作者认为基因 CENPA 有望成为 PDAC 的潜在治疗靶点。

拾壹

ELEVEN

药物敏感性与 CENPA 表达和分子对接的相关性分析
根据作者的实验结果,作者观察到肿瘤组织中 CENPA 的表达升高,这与患者预后呈负相关。作者进一步旨在研究是否存在与 CENPA 相关的潜在抗肿瘤药物。首先,作者通过 BEST 网站研究了多个胰腺癌数据集中与 CENPA 基因表达水平相关的小分子抗肿瘤药物(图 9A)。这种方法使作者能够识别可能专门针对受 CEMPA 影响的通路的药物。作者从两个不同的数据库中选择了两种与 CENPA 高表达呈正相关的抗肿瘤药物,包括白桦脂酸和 GSK2126458。然后,作者进行分子对接,研究这两种药物与 CEMPA 的结合亲和力。这种计算方法对于预测这些药物与靶蛋白相互作用的程度至关重要,这是药物开发的关键步骤。结果表明,两种药物对 CENPA、白桦脂酸 (-8.1 kcal/mol) 和 GSK2126458 (-8.6 kcal/mol) 均表现出很强的亲和力(图 9B)。这些值表明良好的结合相互作用,表明两种药物都可能抑制 CENPA 活性或破坏其在肿瘤细胞中的功能。总体而言,作者的研究结果表明,CENPA 不仅是胰腺癌预后不良的标志物,也是一个潜在的治疗靶点。需要进一步的研究来验证白桦脂酸和 GSK2126458 在临床前模型中的疗效,以及探索 CENPA 促进肿瘤发生和耐药的潜在机制。

总结

胰腺导管腺癌 (PDAC) 作为最可怕和最致命的恶性肿瘤之一而享有盛誉。在肿瘤微环境中,癌细胞已经获得了通过代谢重构响应缺氧而维持不断扩增和增加增殖的能力,从而导致肿瘤环境中的乳酸水平升高。然而,专门调查 PDAC 中缺氧和乳酸代谢相关乳酸化之间关联的研究有限。在这项研究中,采用了多种机器学习方法,包括 LASSO 回归分析、 XGBoost 和随机森林,来识别枢纽基因并构建预后风险特征。CERES 评分和单细胞分析的实施用于识别 PDAC 管理的前瞻性治疗靶点。CCK8 检测、集落形成检测、transwell 和伤口愈合检测用于探索受 CENPA 影响的 PDAC 细胞的增殖和迁移。总之,作者发现了两种不同的亚型,其特征是其独特的缺氧和乳酸化特征,并开发了风险评分来评估 PDAC 患者的预后以及对免疫治疗和化疗的反应。此外,作者表明 CENPA 可能作为 PDAC 的一个有前途的治疗靶点。