2022-11-08 18:06:52, 西湖欧米wOmics 西湖欧米(杭州)生物科技有限公司
甲状腺结节很常见,大约 60% 的普通人群会检出甲状腺结节,且女性患病率高于男性 [1,2]。这些结节中大多数是无症状的,只有大约 15% 的不确定结节会被确定为恶性。由于许多良性结节的病因不确定性,在临床上难以做出正确诊断,因此这些患者经常接受不必要的手术。甲状腺结节诊断的一个主要挑战是区分甲状腺滤泡腺瘤(FA) 和滤泡癌 (FTC)。近日,西湖大学等多研究团队合作在Molecular Oncology发表了题为Stratification of follicular thyroid tumours using data-independent acquisition proteomics and a comprehensive thyroid tissue spectral library的研究论文。
研究人员使用压力循环技术 (PCT)辅助的样本前处理方法 [3,4],首先通过DDA-MS构建了一个涵盖五种甲状腺组织的多肽谱图库,谱图库中包含了 121 960 条肽段和 9941 个蛋白质。通过该谱图库,量化了来自3对甲状腺乳头状癌与配对癌旁组织的7863个蛋白。此外,在46例甲状腺滤泡型肿瘤组织中,定量检测到7847 种蛋白质,其中204个蛋白为滤泡癌与滤泡腺瘤的差异蛋白;同时,也通过靶向蛋白质定量的平行反应监测 (PRM) 方法验证了37种蛋白。总之,本文构建了一个包括良性和恶性甲状腺结节以及健康甲状腺的组织特异性多肽谱图库,可用于靶向PRM和非靶向DIA的甲状腺蛋白质组学分析。该谱图库为甲状腺疾病的蛋白质组学探索提供了宝贵的资源和强有力的参考。
实验设计
组织样本:
建库组织样本,四种常见的FFPE甲状腺结节组织病理学类型,结节性甲状腺肿(MNG, N=42)、滤泡腺瘤(FA, N=49)、滤泡癌(FTC, N=33)和 乳头状癌 (PTC, N=54),以及正常甲状腺组织(N=10)。
实验设计:
图1. 综合甲状腺特异性谱库的生成、验证和应用。左图,谱库的生成。使用压力循环技术 (PCT) 收集并准备了五种类型的甲状腺组织用于蛋白质组学分析。使用强阳离子交换 (SCX) 或高 pH 反相色谱分离三个合并的甲状腺样品。使用数据相关采集 (DDA) MS 分析每个肽分数,以使用 Spectronaut v14.6 生成谱库。中间,谱库的验证。已建立的库通过四种 DIA 数据采集策略进行了验证。右图,谱库在多中心研究中应用于滤泡性甲状腺腺瘤和癌的蛋白质组学分析。N*,癌旁组织。
实验结果
1
甲状腺谱库构建
本研究总共收集了五种甲状腺组织,即正常组织,两种良性结节MNG和FA,以及两种类型的甲状腺癌 FTC 和 PTC,本研究构建了一个甲状腺特异性谱库,以支持通过 DIA-MS 对甲状腺结节中的蛋白质进行鉴定和定量(图 1)。
样本经PCT消化处理后,通过强离子交换或高PH反向色谱分馏以获得较高的肽覆盖率。分馏后的肽样本通过60分钟梯度LC-MS分析,总共获得了 46 个 DDA 文件。构建的甲状腺特异性谱库包含 925 330 个过渡基团、157 548 个前体、121 960 个肽段、9941 个蛋白质(表 1)。然后,通过使用四种不同采集策略获得的四个 DIA 数据集验证了该库,并将其应用于 FA 和 FTC 的蛋白质组学分层(图 1)。
表1. 甲状腺特异性多肽谱图库
2
甲状腺谱库特点
在该谱库中,肽母离子 m/z 介于 400 Th 和 1200 Th 之间,大约 82% 的母离子 m/z 介于 400-850 Th 之间(图 2A)。母离子主要显示两个 (53%) 或三个 (37%) 电荷,它们的电荷分布与不同谱库的电荷分布相当(图 2B)。82% 的肽是 8-20 个氨基酸长,中位长度为 14 个氨基酸,与胰蛋白酶肽的特性一致(图 2C)。在 121 960 条肽段中检测到 22 853 条氧化蛋氨酸,这是谱库中最常见的修饰。样品制备在半胱氨酸残基处产生了 2818 个氨基甲酰化肽和 2231 个 N 末端乙酰化肽(图 2D)。总共检测到 7634 种蛋白质,其中至少含有 3 种蛋白质类型肽,近一半的蛋白质含有 10 种以上的肽(图 2E)。此外,由于碰撞模式,更多来自 y 离子的碎片比来自 b 离子的碎片被检测到(图 2F)。与现有谱库相比,该甲状腺特异性谱库包括已发表的泛人类谱库(PHL)和 DIA泛人类谱库(DPHL)中未涵盖的572个蛋白质和35 384个肽段(图 2G)。
研究人员接下来使用基因本体 (GO) 来识别该库中主要富集的蛋白质类别。IPA 软件共注释了 9826 种蛋白质,如图 2H 所示。通过与激酶数据库 KinMap 比较,发现该甲状腺特异性谱库包含来自 7 个家族的 340 种激酶,占整个激酶数据库的 63.4% (340/536)(图 2I)。
图2. 甲状腺特异性多肽谱图库的表征和统计。(A) 母离子 m/z 的分布。(B) 不同母离子电荷状态的计数。(C) 肽段长度的分布。(D) 修饰肽的数量和三种修饰的分布。(E) 每种蛋白质的肽段的数量及其相应的比率和计数。(F) 每种碎片离子类型的计数。(G) 新构建的甲状腺特异性谱图库与全人谱图库PHL 和 DPHL的蛋白与肽段信息比较。(H)蛋白质亚细胞定位(红色字体)和功能类型(黑色字体)注释。(I) 在甲状腺特异性谱库中,共有来自7 个家族的 340 个激酶(以不同的树色区分)。
3
四种DIA策略获取的四个数据集的技术验证
为进一步验证建立的甲状腺特异性谱库,研究人员分析了三个 PTC 样本以及配对的癌旁组织。然后,使用以下四种策略获取四个数据集:单次 DIA(数据集 1)、PulseDIA(数据集 2)、预分馏 DIA(数据集 3)以及预分馏和 PulseDIA 的组合(数据集 4)。随后,使用 Spectronaut(14.6 版)和 DIA-NN(1.7.15 版)针对建立的甲状腺组织特异性谱库分析所有数据集,搜索结果如图 3所示。
所有三种肿瘤组织都比匹配的正常甲状腺组织(癌旁组织)表达更多的蛋白质和肽,尤其是肽水平(图 3A,B)。由于梯度相对较短且存在高丰度的甲状腺球蛋白,因此使用单次 DIA 鉴定的肽和蛋白质的数量最少。PulseDIA 和预分馏 DIA 鉴定的更多。PulseDIA 比预分馏 DIA 鉴定出更多的肽,但蛋白质的数量类似。预分馏和 PulseDIA 的组合在肽和蛋白质水平上产生了最佳结果:65 544 个肽和 7863 个蛋白质。
研究人员还计算了肽和蛋白质丰度的变异系数 (CV),以评估这些数据集的质量。所有数据集的中位肽 CV 均小于 0.05(图 3C),中位蛋白 CV 均小于 0.04(图 3D)。
图3. Spectronaut 搜索的甲状腺特异性谱库的技术验证结果。通过搜索甲状腺特异性谱库获得鉴定的 (A) 肽和 (B) 蛋白质。肿瘤 (T_CV) 及其癌周组织 (N_CV) 中 (C) 肽和 (D) 蛋白质丰度的变异系数。
4
FA和FTC样品的蛋白质组学分析
研究人员通过 PCT-PulseDIA 和DIA-NN 的方法流程将 46个甲状腺滤泡型肿瘤 (n = 24) 和 FTC (n = 22) 的蛋白质组与由此建立的甲状腺谱库进行比较。通过该谱库,鉴定了 103 663 个肽母离子、76 019 个肽和 7847 个蛋白质组以及 7777 个蛋白质。在 FA 和 FTC 中,7777 个蛋白中有7643 个(98.3%)得到了鉴定(图 4A)。
两种样本类型之间共有 204 个 差异蛋白(DEP),包括 139 个上调蛋白、56 个下调蛋白和 9 个只能在 FTC 中检测到的蛋白(图 4C)。在204 个 DEP 中,有 5 个与癌症基因组图谱 (TCGA) 转录组数据分析的 345 个甲状腺癌预后相关基因列表相匹配。箱形图中展示了前六种显著失调的蛋白质的表达(图 4D)。此外,对204 个 DEP 的通路富集分析表明, 铁死亡信号通路被显著激活(图 4E)。
此外,研究人员从 204 个 DEP 中选择了 31 种蛋白质,通过 geNetClassifier 区分 FTC 和 FA。Pearson 相关系数的无监督聚类热图显示,基于 31 种蛋白质的表达,FA 和 FTC 分离良好(图 4F)。
图4. 根据DIA方法和已建立的谱库对FTC和FA进行分层。(A) FA 和 FTC 之间的蛋白质鉴定重叠率为 98.3%。(B) FA 和 FTC 无法根据 7777 个蛋白的表达进行分离。(C) 火山图以 |log2(fold change)| 的阈值≥ 1,P值<0.05,突出显示DEP。(D) 前六个 DEP 在 FA 和 FTC 中表达显著失调。(E) 204 个 DEP 的通路富集分析。(F) 由 geNetClassifier 选择的 31 种蛋白质,每两个样本之间 Pearson 相关系数的无监督层次聚类热图。
为了进一步验证 SVM 中差异表达和特征蛋白质的可靠性,研究人员从一家独立医院收集了另一个数据集,并通过 PRM(一种靶向蛋白质组学策略)检测了所选蛋白质中的肽。PRM 检测到的 37 种蛋白质(来自 DEP 的 6 种蛋白质和来自 geNetClassifier 的 31 种蛋白质)中,确认新样本集中有 9 种蛋白质显著失调(调整后的 P 值 < 0.05),与 PulseDIA 数据匹配(图 5A,B),九种蛋白质中有四种位于膜中,并且这四种蛋白质是酶或磷酸酶。九种蛋白质的两组比较的倍数变化和调整后的 P 值列于表 2,这九种蛋白质有望成为区分 FA 和 FTC 肿瘤的生物标志物。
表2. 通过PRM确认的九个差异表达的蛋白质
图5. 九种选定蛋白质的 PRM-MS 分析。(A) 母离子的代表性峰组色谱(左)和 FA 和 FTC 中蛋白质丰度(右)。通过双尾学生 t 检验计算统计显著性。(B) 每个样本中九种蛋白质的表达,以及18例FA和 19例FTC样本中的九种蛋白质的平均表达。
实验结论
总之,本研究为甲状腺组织样本的 DIA 和 PRM 分析提供了一个综合谱库,并发现了九种潜在的用于分离甲状腺滤泡腺瘤 (FA) 和滤泡癌 (FTC) 的特征蛋白,为甲状腺疾病的蛋白质组学探索提供了宝贵的资源,具有十分可靠的参考价值。
参考文献
文献链接:https://febs.onlinelibrary.wiley.com/doi/full/10.1002/1878-0261.13198
编译:陈善军
审校:孙耀庭、钱丽琴、江燕
西湖欧米的DIA/4D-DIA/PulseDIA业务:
相对于DDA技术而言,DIA能够在单位时间内鉴定得到更多的多肽和蛋白质。
DIA带来高准确性、高重现性和高稳定性。
DIA仅需要极低的样本量就可以实现高灵敏度检测。比如DIA和PulseDIA, 只需要500ng的多肽就可以;而4D-DIA(diaPASEF)则更低,仅需要200ng的多肽。
PulseDIA技术,是西湖欧米的特色,更是西湖欧米独有专利。PulseDIA能够在传统DIA技术的基础上,将一个窗口根据质荷比分割成更小范围的多个窗口,并且将这些窗口以脉冲的形式均匀分配至不同的质谱方法进行采集。该方法能够带来相较于传统DIA更高的鉴定深度。
感兴趣的客户欢迎咨询
service@westlakeomics.com
(0571) 8678 9136
西湖欧米近期活动:
点击图片预约直播
关于西湖欧米
专注于生物技术攻关与辅助临床诊断与治疗的创新型生物科技公司。针对与生命健康有关的核心问题,西湖欧米致力于以技术创新为驱动力、以多模态大数据为基础,使用 AI 赋能微量临床组织的高通量蛋白质组分析等组学技术辅助精准医学和药物研发。
西湖欧米公众号
西湖欧米官网
04-02 ACD/Labs
展会预告 | 盛瀚邀您共聚青岛市分析测试学会年会系列学术报告会暨科学仪器展!04-02 SHINE
叮~基泰生物清明节放假通知,请查收!04-02 基泰生物
【内附详细日程】因科技 · 纳万物 | 2024进化发育学术论坛04-01
如何在环境监测的背景下,全面掌握三维荧光光谱?【4月16日 | 在线讲座】04-01 HORIBA
大昌华嘉开展鲁道夫(Rudolph) Autopol系列旋光仪质量服务月04-01 大昌华嘉
邀请函 | 2024中国油气开发技术年会暨油气开发新成果及新技术展示会04-01 大昌华嘉
邀请函 | IBQC第三届国际生物药质量大会04-01 大昌华嘉
邀请函 | 2024青岛市分析测试学会04-01 大昌华嘉
大昌华嘉科学仪器部荣获Bruker 2023年度“最具影响力合作伙伴奖”04-01 大昌华嘉
展会预告 | LUMEX诚邀您参加CIEPEC中国国际环保展览会!04-01
仅用15个月!欧美克仪器获思百吉集团SBS铜牌认证!04-01 质量部 戚海智
4月23日-26日,欧美克与您相约上海国际橡塑展Chinaplas04-01 欧美克仪器
【仪器百科】LS-909丨干湿二合一激光粒度分析仪04-01 欧美克仪器
【每天学点粒度知识】分析仪器的性能评价04-01
【临床研究】mNGS在神外重症中枢神经系统感染的价值研究03-30
尽揽博才英杰,共赴锦绣未来:多个职位等你加入!03-29 HORIBA
纪念梵高诞辰 —— 借光谱之力探艺术巨匠的创作精神03-29 HORIBA
设备更新指南 | 生命科学表征技术推荐03-29 HORIBA
共赴“春城之约”|第十六届中国整合生物样本学大会03-29