Nature Medicine | 解读《酒精相关性肝病的非侵入性蛋白质组学生物标志物》
阅读:1243 时间:2023-08-25

 

01 前言

今天和大家分享一篇将蛋白质组学技术应用于临床科研中的文章,该文章于2022年6月份发表在Nature Medicine(IF=87.241)杂志上,标题为“Noninvasive proteomic biomarkers for alcohol-related liver disease”。该文章的通讯作者是德国马克斯普朗克研究所的Matthias Mann教授,蛋白质组学研究领域的大神级人物。 

 

 

02 研究背景

 

酒精相关性肝病(Alcohol-related liver disease, ALD)是由长期过度饮酒引起的肝脏疾病,它是导致全球肝脏相关死亡的主要原因之一。ALD的主要病理特征包括脂肪变性、肝脏炎症和纤维化,但其具体的分子机制尚不完全清楚。ALD的病情会逐渐发展,最终导致肝硬化。然而,目前大约有75%的ALD患者是在发生肝硬化后才被诊断出来,这使得他们无法及时接受最佳的药物治疗。此外,ALD的病情进展缓慢且无明显症状,使得早期诊断具有挑战性,而现有的非侵入性生物标志物在早期诊断方面的准确性也有限。因此,迫切需要微创诊断策略来筛查高危人群中的ALD患者。生物标志物的发现工作通常集中在单个生物分子上,但是这类标志物在临床的接受率很低。在最新进展中,质谱极大地扩展了蛋白质组学在生物医学和临床研究中的应用范围。基于质谱的蛋白质组学能够对生物或临床样本中存在的数百甚至数千种蛋白质进行特异性鉴定和定量,是研究疾病机制和鉴定生物标志物的有力工具。本文通过对匹配的肝-血浆蛋白质组进行单独和综合的分析,包括差异丰度、功能富集、与组织学评分的相关性、逻辑回归模型ROC-AUC等分析,以病理特征和疾病阶段相关联的方式系统地表征肝脏和血浆中的蛋白质组变化,并确定了在检测肝纤维化、炎症活性和脂肪变性方面具有诊断价值的循环蛋白。

 

03 研究样本

 

1.ALD模型开发队列GALA–ALD,459例血液,有随访数据的前瞻队列,其中79例有匹配的肝脏组织样本。)

2.健康队列GALA–HP,137例血液,与ALD模型开发队列匹配的健康横断面队列。)

3.ALD验证队列GALA–ALD,63例血液。)

 

04 实验设计

 

对于ALD模型开发队列,研究团队通过向不同的诊所、酒精康复中心及社区连续招募存在有害饮酒史的患者(其中任何有已知的慢性肝病和/或明确的失代偿、晚期疾病的个体都被排除在外),这些患者代表疾病早期的无症状ALD。健康队列的年龄(40-75岁)、性别和BMI特征数据与ALD模型开发队列部分匹配。ALD验证队列是由在ALD模型开发队列研究结束后开始的人群筛查研究的独立参与者组成,任何有已知的慢性肝病和/或明确的失代偿、晚期疾病的个体也都被排除在外。采集三个队列的血浆、ALD模型开发队列中与血浆匹配的肝脏活检组织,使用DIA定量技术进行蛋白质组学检测,同时进行临床数据采集。

 1 三个队列参与者的基线期临床数据

 

肝脏蛋白质组样品准备流程:冷冻粉碎样品 → SDC裂解样品 → 95℃振荡加热,蛋白质变性 → 超声 → 37℃胰酶/LysC酶解 → 0.1% TFA终止消化反应 → Stage-Tip纯化肽段 → LC-MS/MS检测。血浆蛋白质组样品准备流程:血浆样品 → SDC反应液 → 95℃加热变性 → 37℃胰酶/LysC酶解 → 0.1% TFA终止消化反应 → Evotip C18 trap柱纯化 → LC-MS/MS检测。见图1。

1 蛋白质组学工作流程

05研究结果

 

1)发现肝病生物标志物的流程

 

如图2所示,在完成采集样本后,研究团队使用了基于质谱的高通量蛋白质组学技术来分析459名ALD模型开发队列患者和137名健康队列对照者的血浆样本,其中还包含ALD模型开发队列中与血浆匹配的79例肝脏活检样本。然后研究者将得到的蛋白质组学数据进行了差异丰度分析、功能富集分析、与组织学评分的相关性分析,并将肝脏和血浆中的蛋白质组数据整合在一起,以捕捉与肝脏疾病阶段相关的血浆蛋白质特征。最后,建立了一个机器学习模型来识别肝纤维化、炎症活动和脂肪变性的早期阶段,并通过使用诊断模型来评估其预后能力。此外,研究者还验证了模型性能,包括在低发病率人群中排除疾病的准确性,以及在独立的ALD验证队列中评估不同蛋白质标志物组的诊断能力。

 

2 肝病生物标志物发现的流程

2)肝脏病变对肝脏和血浆蛋白质组的影响

 

肝脏蛋白质组的差异丰度分析结果显示(图3),共有717种蛋白质在不同的肝脏病变阶段之间存在差异,占肝脏定量蛋白质组的13%。有658种、135种和68种蛋白质分别在纤维化、炎症活性和脂肪变性各阶段中出现显著变化,这表明纤维化是对肝脏蛋白质组影响最大的,其次是炎症,其中有84%在炎症阶段失调的蛋白质在纤维化中也被发现。此外,87%的肝脏特异性蛋白下调,80%的分泌蛋白上调,该结果与该研究团队先前NAFLD(非酒精性脂肪肝病)和肝硬化的研究结果相似。血浆蛋白质组的差异丰度分析结果显示(图4),206种、163种和48种蛋白质分别在纤维化、炎症活性和脂肪变性各阶段中出现丰度差异,有83%的肝脏特异性蛋白下调,64%的分泌蛋白下调。斯皮尔曼相关性分析结果表明,在肝脏蛋白质组中,与纤维化阶段最相关的主要是肝脏的分泌蛋白;在与炎症相关的蛋白中,有50%的蛋白是细胞骨架蛋白,这表明发炎肝脏的细胞结构可能发生变化;与脂肪变性相关的蛋白中出现了PLIN2和FABP4,而FABP4是一种先前被确定为NAFLD患者从单纯性脂肪变性发展为非酒精性脂肪性肝炎的预测标志物(图3)。在血浆蛋白质组中,C7、QSOX1和LGALS3BP在纤维化和炎症中排名前三,而NAFLD潜在标志物ALDOB与脂肪变性阶段具有较高的相关性(图4)。

 

3 肝脏病变导致肝脏蛋白质组重塑

4 肝脏病变导致血浆蛋白质组重塑

 

3)肝脏-血浆蛋白质组数据的整合

 

肝脏-血浆蛋白质组的整合数据显示,有420种蛋白质同时出现在肝脏和血浆定量蛋白质组中,并在二维空间中呈现双峰模式。一些蛋白质的相对丰度在肝脏和血浆中有很强的相关性,形成了诊断簇;而另一组蛋白质则没有相关性,形成了垂直簇。例如,(垂直簇中的)肝酶ALDOB和DPP4在肝脏中的丰度相差约1000倍,而它们在血浆中的水平较低且非常相似。此外,有112种蛋白质的相对丰度在匹配的肝脏和血浆样本中显著相关,例如C7和IGHA1的皮尔逊相关系数r高达0.85。肝组织和循环中的C反应蛋白(CRP)水平也高度相关(r=0.73),值得关注的是,CRP是目前广泛用于评估心血管疾病风险的指标之一。在肝脏和血浆蛋白质组的ANCOVA分析中,共有46种蛋白质在丰度上表现出差异,这些差异涉及免疫和炎症反应、细胞粘附、ECM组织、蛋白酶抑制剂和细胞内酶蛋白等方面。从纤维化阶段F0到F4,大多数密码子调节蛋白的丰度均增加,包括PIGR、LGALS3BP、TGFBI和C7,而这些蛋白都被报道为肝脏疾病的潜在标志物。

 

5 肝脏-血浆蛋白质组数据整合

 

4)基于血浆蛋白质组的纤维化、炎症和脂肪变性预测模型的建立

 

为了筛选早期ALD的生物标志物,研究者首先比较了22个最先进的机器学习分类器,并选择了逻辑回归模型作为最终分类器。通过使用“最小冗余-最大相关性”(mRMR)特征选择算法,他们分别选择了三组蛋白质标志物来识别显著纤维化(≥F2)、轻度炎症(≥I2)和任何肝脂肪变性(≥S1)。基于选定标志物的逻辑回归模型预测显著纤维化、轻度炎症活动和任何脂肪变性的交叉验证ROC–AUC值分别为0.90、0.85和0.91,这说明该逻辑回归模型具有较高的分类性能。同时,与广泛接受的15项最先进的临床试验相比,所有的蛋白质组学模型都具有最高的F1分数和平衡准确性。


基于血浆蛋白质组的纤维化、炎症和脂肪变性预测模型建立

 

5)模型性能验证及预后能力评估

 

在健康匹配对照组(n=136)中,蛋白质组学模型正确排除了显著纤维化、晚期纤维化和轻度炎症,准确率分别为99%、100%和98%。尽管约15%的健康个体被归类为脂肪变性阳性,但由于他们的体重指数(BMI)与GALA–ALD队列相匹配,而且单纯的脂肪变性不是排除标准,因此临床上可能会出现分配错误。对于有酒精滥用史且因肝硬度低而未进行活检的ALD模型开发队列患者(n=97),蛋白质组学模型正确地分别排除了93%和100%的显著和晚期纤维化。此外,作者通过独立的ALD验证队列(n = 63)来验证模型的分类性能,F2、I2和S1蛋白质组学模型的ROC-AUC值分别是0.87、0.81和0.79,并且蛋白质组学模型的ROC–AUC优于现有的同类最佳临床试验模型。

为了评估模型对预后能力的预测准确性,研究团队使用了丹麦全国范围内的电子健康记录,对GALA-ALD队列中的457名患者进行了长达53个月的随访,随访内容主要包括两类:肝脏相关事件和全因死亡。与竞争的商业生物标志物和肝纤维化的组织学分期方法相比,该团队的F2蛋白质组学模型对肝脏相关事件发生和全因死亡均具有最高的预测准确率(Harrell’s CROC-AUC值)。

 

7 模型性能验证及预后能力评估

 

06 结论

基于DIA-MS的蛋白质组学技术,本研究使用了一种匹配肝-血浆蛋白质组学的方法,分析了659例血浆样本和79 例肝活检样本的蛋白质组学数据。基于选定血浆蛋白质标志物组的逻辑回归模型预测显著纤维化、轻度炎症活动和任何脂肪变性的平均交叉验证ROC–AUC值分别为0.90、0.85和0.91,并且该蛋白质组学模型比现广泛应用的临床模型具有更高的性能准确性和预测准确性。总的来说,该研究成果为基于质谱的常规肝病检测奠定了基础。

 

07 总结

这项研究的最大优势是拥有一个庞大的、深入表型的研究队列,将肝活检作为诊断标志物的参考标准,并且有着完整的全国电子健康记录。ALD模型开发和验证队列均由连续招募的患者组成,代表了失代偿开始前无症状慢性ALD的全谱患者,由此避免了在许多发现生物标志物的研究中存在的选择偏差。这项研究的局限性主要是将NAFLD分级和分期系统应用于ALD。虽然NAFLD和ALD有共同的组织学表现,但是ALD的一些预后特征(如胆汁淤积和Mallory-Denk小体)在NAFLD分级中没有考虑。但该研究结果对开发潜在的ALD治疗方案具有启示意义,不仅证实了先前NAFLD的发现,还提供了对ALD具有诊断、预后和治疗价值的潜在蛋白质靶点,这种发现临床生物标志物的方法还是非常值得我们借鉴的。

 

参考文献

Niu, Lili et al.“Noninvasive proteomic biomarkers for alcohol-related liver disease.” Naturemedicine vol. 28,6 (2022): 1277-1287.