2026-05-26 09:38:59 Know it All光谱数据库
研究背景
肺鳞状细胞癌(LSCC)属于非小细胞肺癌的重要亚型,其中IB期代表了疾病进展的关键阶段。尽管根治性手术是当前治疗的基石,但是在鳞癌驱动基因突变比例较低的背景下,对于术后的辅助治疗策略(尤其是化疗)仍缺乏全球统一的循证医学指南。这种临床决策上的不确定性,亟需强大的、能结合患者个体特征的预测模型来指导治疗走向。
文章概述
本研究由北医三院胸外科强光亮、林楚童和华中科技大学丁群哲等多位专家团队合作完成,利用了大规模SEER数据库的队列数据,结合先进的机器学习(LightGBM)和SHAP可解释性算法,成功开发并外部验证了一个高精度的IB期LSCC生存预测框架。我们的研究不仅为患者提供了个体化的生存风险评估,更通过严格的倾向性评分匹配方法,深入探讨了术后辅助化疗是否能提供独立的生存获益。
正文
1. 模型构建与验证
为实现这一目标,我们首先利用机器学习方法搭建了生存预测模型。研究发现,在多种算法中,LightGBM模型凭借其卓越的泛化能力和稳健性,在内部队列中表现出最高的鉴别诊断能力(1年、3年和5年生存的AUC分别为0.834、0.828和0.800,详见表1)。
Table 1 Model Perform Comparison of 1-, 3- and 5-years survival in the internal cohort
Performance | LR | RF | GBM | XGBoost | LightGBM | CatBoost |
AUC | 0.8237 | 0.8123 | 0.8218 | 0.8151 | 0.8343 | 0.8059 |
Accuracy | 0.7611 | 0.7500 | 0.7706 | 0.7389 | 0.7690 | 0.7563 |
Precision | 0.7499 | 0.7379 | 0.7596 | 0.7276 | 0.7589 | 0.7443 |
Recall | 0.7553 | 0.7411 | 0.7653 | 0.7335 | 0.7669 | 0.7463 |
F1-score | 0.752 | 0.7393 | 0.7618 | 0.7297 | 0.7615 | 0.7452 |
Performance | LR | RF | GBM | XGBoost | LightGBM | CatBoost |
AUC | 0.8221 | 0.7953 | 0.8195 | 0.8121 | 0.8283 | 0.8063 |
Accuracy | 0.7963 | 0.7786 | 0.8037 | 0.7916 | 0.7926 | 0.7870 |
Precision | 0.7050 | 0.6692 | 0.7134 | 0.6942 | 0.7158 | 0.6865 |
Recall | 0.6253 | 0.6301 | 0.5786 | 0.6577 | 0.6714 | 0.6547 |
F1-score | 0.6433 | 0.6427 | 0.5853 | 0.6710 | 0.6873 | 0.6666 |
Performance | LR | RF | GBM | XGBoost | LightGBM | CatBoost |
AUC | 0.7908 | 0.7771 | 0.7989 | 0.7910 | 0.7995 | 0.7806 |
Accuracy | 0.8175 | 0.8136 | 0.8175 | 0.8159 | 0.8229 | 0.8097 |
Precision | 0.6787 | 0.6722 | 0.6851 | 0.6774 | 0.6967 | 0.6631 |
Recall | 0.5814 | 0.6083 | 0.5308 | 0.6065 | 0.6173 | 0.6059 |
F1-score | 0.5952 | 0.6251 | 0.5157 | 0.6239 | 0.6374 | 0.6214 |
更重要的是,LightGBM模型在独立的外部验证队列中也保持了强大的预测能力1年、3年和5年生存的AUC分别为0.840、0.815和0.790,详见表2)。这一系列的性能验证有力地证实了我们所构建的预测模型的可靠性和普适性。
Table 2 Model Perform Comparison of 1-, 3- and 5-years survival in the external validation cohort
Performance | LR | RF | GBM | XGBoost | LightGBM | CatBoost |
AUC | 0.8483 | 0.8241 | 0.8420 | 0.8328 | 0.8396 | 0.8352 |
Accuracy | 0.7534 | 0.7041 | 0.7233 | 0.7260 | 0.7370 | 0.7233 |
Precision | 0.7654 | 0.7188 | 0.7394 | 0.7350 | 0.7486 | 0.7425 |
Recall | 0.7611 | 0.7127 | 0.7323 | 0.7326 | 0.7445 | 0.7331 |
F1-score | 0.7531 | 0.7033 | 0.7225 | 0.7259 | 0.7367 | 0.7221 |
Performance | LR | RF | GBM | XGBoost | LightGBM | CatBoost |
AUC | 0.8018 | 0.7892 | 0.8028 | 0.8041 | 0.8145 | 0.8072 |
Accuracy | 0.7117 | 0.7045 | 0.6541 | 0.7207 | 0.7027 | 0.7243 |
Precision | 0.7267 | 0.6873 | 0.3276 | 0.7225 | 0.7285 | 0.7251 |
Recall | 0.6011 | 0.6055 | 0.4986 | 0.5830 | 0.6216 | 0.6281 |
F1-score | 0.5916 | 0.6026 | 0.3954 | 0.5627 | 0.6217 | 0.6302 |
Performance | LR | RF | GBM | XGBoost | LightGBM | CatBoost |
AUC | 0.7961 | 0.7763 | 0.7906 | 0.7878 | 0.7909 | 0.7942 |
Accuracy | 0.7174 | 0.7080 | 0.7221 | 0.7017 | 0.7331 | 0.7316 |
Precision | 0.6805 | 0.6990 | 0.6836 | 0.3509 | 0.7041 | 0.7078 |
Recall | 0.5460 | 0.5599 | 0.5151 | 0.5000 | 0.5859 | 0.5757 |
F1-score | 0.5159 | 0.5412 | 0.4484 | 0.4124 | 0.5820 | 0.5652 |
2. 深层因素解析——SHAP的贡献
除了预测能力本身,本研究的最大亮点在于结合了SHAP可解释性算法对模型黑箱的打开。分析结果清晰地揭示了影响IB期LSCC患者生存期的核心因素:首先是治疗类型本身(手术根治)构成了最大的影响,接受了根治性手术的病人预后大大好于未能接受手术的患者(图1);其次是患者的年龄(图2)和淋巴结清扫数量(图3)情况。 我们通过局部SHAP值分析进一步观察到:能否达到充分的区域淋巴结清扫是影响预后的关键环节,而年龄则以非线性关系出现。淋巴结越多、淋巴结切除越彻底,生存获益越高。
Fig 1. SHAP local plot for Surgery type
Fig 2. SHAP main effect and interaction plots for Age across 1-, 3-, and 5-year survival models
Fig 3. SHAP main effect and interaction plots for Regional Nodes Examined
3. 核心矛盾的解决——化疗的价值
然而,在临床上最大的争论点——术后化疗是否带来额外生存获益——是本研究最为深入的部分。我们采用了先进的倾向性评分匹配(PSM)技术,成功地将“术后仅手术”组与“术后手术+化疗”组的患者在年龄、体型等基线特征上做了严格平衡。经过这一匹配,两组患者具有高度可比性。随后进行的生存分析显示,在这群已达到完美匹配的患者中,两种治疗策略的总体生存期无统计学上的显著差异(HR = 1.01, P = 0.893)(Figure 4)。研究者通过亚组分析发现,该结论在不同的年龄、肿瘤分化程度、淋巴结清扫程度、肿瘤大小的亚组人群中均保持稳定。
Fig.4 Kaplan-Meier Survival Curve by Surgery Type for all of patients after PSM
综上所述,本研究的发现具有重大的临床指导意义:对于IB期LSCC患者而言,手术切除与充分的淋巴结清扫是当前根治的最大基石。而术后辅助化疗并非必然的、具有独立生存获益的增量治疗。这一发现提示临床医生应从“是否加化疗”的传统思维中跳脱出来,转而将精力集中在如何最大化手术质量、实现精准的风险分层上。未来,若要为LSCC患者找到化疗的突破性指征,还需要结合分子标志物或液体活检等前沿生物标记物的研究。
论文信息
Optimizing Surgery Strategies in Stage IB Lung Squamous Cell Carcinoma: Insights from Interpretable Machine Learning
Qunzhe Ding, Chutong Lin, Yatsu Lam, Fuxin Guo, Shanwu Ma, Guangliang Qiang*
Thoracic Cancer
DOI:10.1111/1759-7714.70270
原文链接:
https://onlinelibrary.wiley.com/doi/10.1111/1759-7714.70270
期刊介绍
Thoracic Cancer 是一本国际期刊,旨在促进国际合作与交流肺、食道、纵膈、乳腺和其他胸腔恶性肿瘤的基础、转化和应用临床研究方面的全面、前沿信息。编辑部鼓励与胸腔外科、医学肿瘤学、治疗放射学、诊断成像、病理学以及与胸腔癌症相关的基础或转化研究相关的论文投稿。我们也欢迎与胸腔癌症的预防、流行病学和支持性/姑息治疗相关的投稿。
Thoracic Cancer 出版各种类型的论文,包括:原创论文、综述、简评/短篇综述、社论、临床指南、技术说明、会议报告、病例报告、致编辑的信、简短报告、评论文章、研究方案、病例影像与解析。期刊最新影响因子为2.3,在JCR学科ONCOLOGY中位列Q3区,排名208/328;在学科RESPIRATORY SYSTEM中位列Q2区,排名51/108。欢迎赐稿!
期刊主页:https://onlinelibrary.wiley.com/journal/17597714
投稿链接:https://onlinelibrary.wiley.com/page/journal/17597714/homepage/forauthors.html
我们认为影响因子并不是衡量一本期刊成功与否的唯一标准,我们正在改进衡量和提升 Wiley 期刊影响力和作者科研成果影响力的方式。在未来,我们将采用更广泛的基于期刊和基于文章的评价指标,以提供更丰富的形式来展示期刊表现。
威立(Wiley)是权威内容与科研智慧领域的全球领导者,致力于推动科学探索、创新发现与学习发展。两个多世纪以来,我们始终立于学术生态体系的中心,将悠久的出版传承与人工智能驱动的平台深度融合,重塑知识的发现、获取与应用方式。从独立研究员、莘莘学子到世界500 强企业的研发团队,威立始终助力将先进的科学突破转化为切实的社会实践。从知识到影响力 —— 我们正在重新定义科学与求知领域的无限可能。
点赞,在看,分享,来个一键三连吧!
05-25 兰友科技
科研不容误差,工业拒绝偏差|揭秘精准测量背后的光谱力量05-22
兰格2026年度用户之声有奖调研开启,京东E卡免费送!05-22
【企业动态】Octave Attune EAM(原HxGN EAM)现已获得SAP认证,可与SAP S/4HANA集成05-22
【研讨会邀请】瑞士步琦参加CBPT2026第十六届中国生物制药分离纯化技术创新发展论坛05-22 ZBL
70年只为一件事:让熔点测定更准、更稳、更智能05-22 JXZ
【线上研讨会邀请】凯氏定氮在生物制品的质控应用及合规解读开始报名啦!05-22
展会邀请丨聚焦前沿科研仪器,奥谱天成即将亮相第64届中国高等教育博览会05-21
《Advanced Energy Materials》MgH₂储氢再提速:五元高熵氧化物催化实现195℃低温脱氢与室温秒级吸氢05-21 CIQTEK
国仪「镜」囊妙计 · 第七期|破解金属电镜成像难题05-21 CIQTEK
痕量有机物的“去除神器”——LC-Pak®终端过滤器05-21 默克MilliQ纯水
前沿应用|小角X射线散射 (SAXS) 在食品学中的纳米级探测05-21
D7 Mate 应用案例|同一种白糖,为什么XRD结果差这么多?05-21
有机合成重复性差,可能不是“玄学”05-21 大龙兴创仪器
应用案例|氯氮平片的含量测定05-21
走进实验室 | 广电计量电离辐射计量与放射卫生检测服务方案05-21
从顶层规划到合规赋能 | 广电计量AI数智化转型全栈服务方案重磅发布05-21
Nature 50万人数据证实:睡多睡少都催老,别再迷信8小时!05-21
北裕仪器携“黑灯实验室”亮相第十二届给水大会05-21
植物细胞培养总被聚集体困扰?这对“监测+表征”组合给出新解法05-21 小贝







