Thoracic Cancer | 北医三院强光亮课题组:机器学习预测IB期LSCC生存及辅助化疗的价值评估

2026-05-26 09:38:59 Know it All光谱数据库




研究背景



肺鳞状细胞癌(LSCC)属于非小细胞肺癌的重要亚型,其中IB期代表了疾病进展的关键阶段。尽管根治性手术是当前治疗的基石,但是在鳞癌驱动基因突变比例较低的背景下,对于术后的辅助治疗策略(尤其是化疗)仍缺乏全球统一的循证医学指南。这种临床决策上的不确定性,亟需强大的、能结合患者个体特征的预测模型来指导治疗走向。



文章概述



本研究由北医三院胸外科强光亮林楚童和华中科技大学丁群哲等多位专家团队合作完成,利用了大规模SEER数据库的队列数据,结合先进的机器学习(LightGBM)和SHAP可解释性算法,成功开发并外部验证了一个高精度的IB期LSCC生存预测框架。我们的研究不仅为患者提供了个体化的生存风险评估,更通过严格的倾向性评分匹配方法,深入探讨了术后辅助化疗是否能提供独立的生存获益。



正文



1. 模型构建与验证

为实现这一目标,我们首先利用机器学习方法搭建了生存预测模型。研究发现,在多种算法中,LightGBM模型凭借其卓越的泛化能力和稳健性,在内部队列中表现出最高的鉴别诊断能力(1年、3年和5年生存的AUC分别为0.834、0.828和0.800,详见表1)。

Table 1 Model Perform Comparison of 1-, 3- and 5-years survival in the internal cohort

Performance

LR

RF

GBM

XGBoost

LightGBM

CatBoost

AUC

0.8237

0.8123

0.8218

0.8151

0.8343

0.8059

Accuracy

0.7611

0.7500

0.7706

0.7389

0.7690

0.7563

Precision

0.7499

0.7379

0.7596

0.7276

0.7589

0.7443

Recall

0.7553

0.7411

0.7653

0.7335

0.7669

0.7463

F1-score

0.752

0.7393

0.7618

0.7297

0.7615

0.7452


Performance

LR

RF

GBM

XGBoost

LightGBM

CatBoost

AUC

0.8221

0.7953

0.8195

0.8121

0.8283

0.8063

Accuracy

0.7963

0.7786

0.8037

0.7916

0.7926

0.7870

Precision

0.7050

0.6692

0.7134

0.6942

0.7158

0.6865

Recall

0.6253

0.6301

0.5786

0.6577

0.6714

0.6547

F1-score

0.6433

0.6427

0.5853

0.6710

0.6873

0.6666


Performance

LR

RF

GBM

XGBoost

LightGBM

CatBoost

AUC

0.7908

0.7771

0.7989

0.7910

0.7995

0.7806

Accuracy

0.8175

0.8136

0.8175

0.8159

0.8229

0.8097

Precision

0.6787

0.6722

0.6851

0.6774

0.6967

0.6631

Recall

0.5814

0.6083

0.5308

0.6065

0.6173

0.6059

F1-score

0.5952

0.6251

0.5157

0.6239

0.6374

0.6214


更重要的是,LightGBM模型在独立的外部验证队列中也保持了强大的预测能力1年、3年和5年生存的AUC分别为0.840、0.815和0.790,详见表2)。这一系列的性能验证有力地证实了我们所构建的预测模型的可靠性和普适性。

Table 2 Model Perform Comparison of 1-, 3- and 5-years survival in the external validation cohort

Performance

LR

RF

GBM

XGBoost

LightGBM

CatBoost

AUC

0.8483

0.8241

0.8420

0.8328

0.8396

0.8352

Accuracy

0.7534

0.7041

0.7233

0.7260

0.7370

0.7233

Precision

0.7654

0.7188

0.7394

0.7350

0.7486

0.7425

Recall

0.7611

0.7127

0.7323

0.7326

0.7445

0.7331

F1-score

0.7531

0.7033

0.7225

0.7259

0.7367

0.7221


Performance

LR

RF

GBM

XGBoost

LightGBM

CatBoost

AUC

0.8018

0.7892

0.8028

0.8041

0.8145

0.8072

Accuracy

0.7117

0.7045

0.6541

0.7207

0.7027

0.7243

Precision

0.7267

0.6873

0.3276

0.7225

0.7285

0.7251

Recall

0.6011

0.6055

0.4986

0.5830

0.6216

0.6281

F1-score

0.5916

0.6026

0.3954

0.5627

0.6217

0.6302


Performance

LR

RF

GBM

XGBoost

LightGBM

CatBoost

AUC

0.7961

0.7763

0.7906

0.7878

0.7909

0.7942

Accuracy

0.7174

0.7080

0.7221

0.7017

0.7331

0.7316

Precision

0.6805

0.6990

0.6836

0.3509

0.7041

0.7078

Recall

0.5460

0.5599

0.5151

0.5000

0.5859

0.5757

F1-score

0.5159

0.5412

0.4484

0.4124

0.5820

0.5652


2. 深层因素解析——SHAP的贡献

除了预测能力本身,本研究的最大亮点在于结合了SHAP可解释性算法对模型黑箱的打开。分析结果清晰地揭示了影响IB期LSCC患者生存期的核心因素:首先是治疗类型本身(手术根治)构成了最大的影响,接受了根治性手术的病人预后大大好于未能接受手术的患者(图1);其次是患者的年龄(图2)和淋巴结清扫数量(图3)情况。 我们通过局部SHAP值分析进一步观察到:能否达到充分的区域淋巴结清扫是影响预后的关键环节,而年龄则以非线性关系出现。淋巴结越多、淋巴结切除越彻底,生存获益越高。

Fig 1. SHAP local plot for Surgery type


Fig 2. SHAP main effect and interaction plots for Age across 1-, 3-, and 5-year survival models


Fig 3. SHAP main effect and interaction plots for Regional Nodes Examined


3. 核心矛盾的解决——化疗的价值

然而,在临床上最大的争论点——术后化疗是否带来额外生存获益——是本研究最为深入的部分。我们采用了先进的倾向性评分匹配(PSM)技术,成功地将“术后仅手术”组与“术后手术+化疗”组的患者在年龄、体型等基线特征上做了严格平衡。经过这一匹配,两组患者具有高度可比性。随后进行的生存分析显示,在这群已达到完美匹配的患者中,两种治疗策略的总体生存期无统计学上的显著差异(HR = 1.01, P = 0.893)(Figure 4)。研究者通过亚组分析发现,该结论在不同的年龄、肿瘤分化程度、淋巴结清扫程度、肿瘤大小的亚组人群中均保持稳定。

Fig.4 Kaplan-Meier Survival Curve by Surgery Type for all of patients after PSM


综上所述,本研究的发现具有重大的临床指导意义:对于IB期LSCC患者而言,手术切除与充分的淋巴结清扫是当前根治的最大基石。而术后辅助化疗并非必然的、具有独立生存获益的增量治疗。这一发现提示临床医生应从“是否加化疗”的传统思维中跳脱出来,转而将精力集中在如何最大化手术质量、实现精准的风险分层上。未来,若要为LSCC患者找到化疗的突破性指征,还需要结合分子标志物或液体活检等前沿生物标记物的研究。



论文信息



Optimizing Surgery Strategies in Stage IB Lung Squamous Cell Carcinoma: Insights from Interpretable Machine Learning

Qunzhe Ding, Chutong Lin, Yatsu Lam, Fuxin Guo, Shanwu Ma, Guangliang Qiang*

Thoracic Cancer

DOI:10.1111/1759-7714.70270

原文链接:

https://onlinelibrary.wiley.com/doi/10.1111/1759-7714.70270



期刊介绍



Thoracic Cancer 是一本国际期刊,旨在促进国际合作与交流肺、食道、纵膈、乳腺和其他胸腔恶性肿瘤的基础、转化和应用临床研究方面的全面、前沿信息。编辑部鼓励与胸腔外科、医学肿瘤学、治疗放射学、诊断成像、病理学以及与胸腔癌症相关的基础或转化研究相关的论文投稿。我们也欢迎与胸腔癌症的预防、流行病学和支持性/姑息治疗相关的投稿。

Thoracic Cancer 出版各种类型的论文,包括:原创论文、综述、简评/短篇综述、社论、临床指南、技术说明、会议报告、病例报告、致编辑的信、简短报告、评论文章、研究方案、病例影像与解析。期刊最新影响因子为2.3,在JCR学科ONCOLOGY中位列Q3区,排名208/328;在学科RESPIRATORY SYSTEM中位列Q2区,排名51/108。欢迎赐稿!

期刊主页:https://onlinelibrary.wiley.com/journal/17597714

投稿链接:https://onlinelibrary.wiley.com/page/journal/17597714/homepage/forauthors.html


我们认为影响因子并不是衡量一本期刊成功与否的唯一标准,我们正在改进衡量和提升 Wiley 期刊影响力和作者科研成果影响力的方式。在未来,我们将采用更广泛的基于期刊和基于文章的评价指标,以提供更丰富的形式来展示期刊表现。


威立(Wiley)是权威内容与科研智慧领域的全球领导者,致力于推动科学探索、创新发现与学习发展。两个多世纪以来,我们始终立于学术生态体系的中心,将悠久的出版传承与人工智能驱动的平台深度融合,重塑知识的发现、获取与应用方式。从独立研究员、莘莘学子到世界500 强企业的研发团队,威立始终助力将先进的科学突破转化为切实的社会实践。从知识到影响力 —— 我们正在重新定义科学与求知领域的无限可能。




点赞,在看,分享,来个一键三连吧!






  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2026 ANTPEDIA, All Rights Reserved