全网最详细 | TMT、LFQ和DIA傻傻分不清?一文读懂三者区别和应用
阅读:1806 时间:2023-08-23

TMTLFQDIA是目前最常用的三种基于质谱的高通量蛋白质组学定量方法。TMT(Tandem Mass Tag,串联质量标签)方法的主要特征是在样品制备环节使用稳定同位素标记试剂与样品的酶解肽段进行反应,使待定量的肽段被标记上由多个基团组成的等质量标签,并在随后的检测中基于标签基团的信号进行多肽和蛋白的定量。

LFQ(Label Free Quantification,非标记定量)方法的主要特征是在样品制备环节无需稳定同位素标记,直接以肽段的检测信号进行肽段和蛋白的定量分析。

DIA(Data-independent Acquisition,数据非依赖性采集)方法的主要特征是其在采集质谱二级谱图时,并非基于一级谱图采集信号强度较高的肽段离子产生的二级谱图,而是根据所有离子质荷比范围划分窗口后依次采集所有肽段离子的二级谱图。由此可见,三种方法是基于其在样品制备和谱图采集层面的主要特征来命名和划分的。

 

图1 三种高通量蛋白质组学技术的特征差异

 

三种技术方法都可以进行高通量的蛋白质组学定量分析,理论上可以相互替代。但由于方法原理不同,这三种定量技术在实际应用中也存在不同的表现和偏向,因此针对不同的研究设计和样品类型,我们通常建议采用不同的定量方法,下面为大家详细说明。

一、TMT

 

TMT是目前最常用的基于稳定同位素标记的定量蛋白质组学技术。除此之外,常见的稳定同位素标记定量技术还有SILAC、双甲基化和iTRAQ。在前篇《蛋白质组学基础入门系列 |(三)蛋白质组学常用技术盘点(上)》中,我们曾介绍过,TMT和iTRAQ两种方法的原理和使用效果几乎一致,分别由Thermo公司和SCIEX公司开发。SCIEX公司开发的iTRAQ标记定量发布更早,但随着TMT技术标记通道的逐渐拓展和Thermo公司Obitrap系列质谱仪器在蛋白质组学市场占有率的提升,TMT技术的应用已逐渐超过和取代iTRAQ技术。

 

图2 TMT与iTRAQ技术的发展历程

 

TMT标记方法存在一定程度的比值压缩效应,比如原本变化3倍的蛋白可能在TMT结果中只检测到2倍的变化。此外,标记试剂需将多个不同标记通道成组使用,每组标记试剂中标记通道的数量决定了二级谱图中能够区分的不同样品的数量上限,也就是能够在一个批次检测中准确定量和比较的样品数量上限。目前标记通道最多的TMTpro 18-plex标记试剂可以同时比较18例不同样品,但在很多研究中,尤其是临床蛋白质组学研究,需要检测和定量比较的样品数量会多于此数。

这种情况下,通常有两种常见的不同做法以克服标记定量技术中标记通道数量的限制:

一是将多个原始样品等量混合(图3左),以混合样品为单位进行标记,并与其他通道标记的混合样品进行定量比较。2022年发表的一项宫颈癌研究就是这样处理的,该研究中将每15例临床样品进行混合后标记,一共使用了90例临床样品,但最终只进行了6个通道的标记和定量比较【1】。这种方法能够极大降低质谱检测的数量和成本,但混合样品忽略了不同临床样品间的个体差异,也难以利用各个患者的临床信息进行关联分析,最终结果的临床价值和临床意义会大打折扣。

 

 

图3 两种不同的大队列样品TMT标记定量处理方法

 

另一种做法是进行多个批次的标记(图3右),在每批次标记的时候添加1个或2个相同的样品进行批次间的搭桥,从而实现不同批次间的比较,以克服单批次标记通道数量的限制。但此种做法也有相当大的局限,因为稳定同位素标记定量技术的定量准确性只体现于同一批次内的定量比较中。2019年的一项研究探讨了多批次标记定量的性能(图4),研究发现在单批次TMT标记中几乎不存在肽段定量缺失值,而随着批次数目的增加,缺失值会急剧增加至约20%-50%;并且,单批次内蛋白定量的CV值中位数约为1.72%,但多批次比较时,批次间蛋白定量的CV值中位数则会上升至10%左右【2】。因此使用多批次TMT标记时,需要更严格的质量控制标准,即便如此,其定量数据的质量和准确性相比单批次的标记定量技术还是会大打折扣。

 

 

图4 多批次TMT标记的数据质量严重降低

 

二、LFQ

广义的LFQ技术包括所有不涉及稳定同位素标记的蛋白质组定量方法,比如早期基于二级谱图计数、肽段数、各类蛋白得分进行的蛋白质定量,或近年来应用较多的DIA定量技术。但狭义上,目前我们常说的LFQ定量技术,通常专指基于质谱DDA检测中根据XIC峰面积计算得到的肽段检测信号强度进行的肽段和蛋白定量的算法和技术。

相比TMT标记定量,LFQ定量在样品制备方面步骤大大减少,因此实验周期更短,成本也更低,对于样品蛋白量的要求也更低。但同时,由于不像TMT标记定量一样可以多个样品混合后一同检测,而是每个样品分别检测,因此其数据受到质谱DDA扫描随机性的影响也更大,相比单批次的TMT标记定量,会具有更多的缺失数据和更大的定量偏差。

有研究比较了TMT和LFQ定量技术的效果差异【3】,在保证仪器参数、样品和检测时长一致的情况下,单批次的TMT相比LFQ具有更少的缺失数据、更高的定量深度和较好的定量准确性。

 

 

 

 

图5 LFQ定量方法与TMT定量方法的效果对比

 

 

不过需要注意的是,上述比较使用的是较复杂的蛋白样品(人与酵母细胞全蛋白)。很多研究表明,在蛋白成分较简单的样品中,TMT标记定量并不一定能获得相比LFQ更多的蛋白鉴定和定量深度【4,5】。

 

 

图6 一项唾液蛋白质组研究(左)和一项血浆蛋白质组学研究(右)中LFQ和TMT两种技术方法定量深度的比较

 

 

三、DIA

 

与LFQ和TMT相比,DIA定量技术在质谱数据采集模式和定量分析算法上有了极大的创新和优化。正如《蛋白质组学基础入门系列 |(四)蛋白质组学常用技术盘点(下)》中介绍的,DIA的数据采集模式相比LFQ和TMT方法中采用的DDA数据采集模式,数据采集更完整全面,随机性更低,因此可以获得更高的定量通量和定量准确性。同时DIA和LFQ一样无需进行稳定同位素标记,因此,既保持了样品的真实度,又不会受到标记通道导致的样品数量限制。

相比传统的LFQ定量方法,DIA可以说是全方位的优化和提升;而相比TMT,二者则是各有特点。在一项2019年发表的研究中,在仪器参数、样品、检测时长和方法步骤相同的条件下,2个具有丰富质谱操作经验的团队分别比较了TMT定量技术和DIA定量技术的表现【6】。针对复杂的蛋白样品(小鼠脑组织),DIA方法的定量深度接近经过分级分离的TMT定量技术。而通过比较人为添加的不同浓度UPS2蛋白在差异蛋白中的鉴定结果,可以发现DIA方法,尤其是不建库的DIA方法(DirectDIA),其定量的准确性已经等同甚至超过TMT定量技术。我们在做不同组别样本的差异蛋白筛选时,定量的准确性对于最终结果也是非常重要的。

 

 

图7 DIA定量方法与TMT定量方法的效果对比

 

 

不建库的DIA方法被称为DirectDIA或library-free DIA,就是不依赖于DDA检测建库的DIA(DDA library-free DIA)。在早期的DIA方法中,由于DIA二级谱图过于复杂,难以进行谱图解析,因此会先使用DDA检测建立二级谱图库来辅助谱图解析以提取定量数据。这种处理方法导致了DIA定量方法复杂程度的提升,同时也使其定量数据质量严重依赖于DDA检测建立的谱图数据库,一定程度上难以发挥DIA检测的优势。随着近年来DIA分析算法的改进和优化,不依赖于DDA谱图库的DIA定量分析算法越来越完善,也得到越来越广泛地应用。

 

 

图8 早期建库DIA和不建库DIA(library-free/direct DIA)的方法流程对比

 

 

一项2023年发表在Nature Communications的研究比较了当前几种常用的DIA数据分析软件及方法的效果【7】。其中2020年发布并持续更新的开源软件DIA-NN使用library-free/directDIA的方法表现出了优秀的定量深度和定量准确性。

 

 

 

图9 不同DIA数据分析软件和算法的定量效果对比

 

 

总结:

 

1. TMT、LFQ和DIA均为高通量的蛋白质组学定量方法,但因原理、步骤的不同,针对不同类型的样品和项目,定量的表现也存在差异和偏向(图10)。

2. 在针对复杂蛋白样品,且样品数量不超过标记通道数量(目前最大18)时,TMT标记定量具有定量深度高和定量重复性好的特点。TMT定量技术通常更适用于样品数量较少,蛋白量较多的细胞或组织样品。此外,实际使用中要留意TMT方法的比值压缩效应。

3. LFQ定量技术具有较低的实验周期和检测分析成本,也没有样品数量限制,对于蛋白成分较简单的样品,也能够达到甚至超过TMT的定量深度,对于样品蛋白量的要求也更低。LFQ定量技术通常更适用于蛋白成分较简单的样品类型,例如体液、纯化蛋白、亚细胞组分等。

4. DIA定量技术能够达到甚至超过TMT的定量性能,实验周期也较短,同时与LFQ定量技术一样无样品数量的限制,且样品蛋白量要求较低。DIA定量技术对于任何类型的项目和样品都能得到较好的定量效果,尤其适用于存在大队列样品的临床研究。

 

 

图10 三种高通量蛋白质组学技术的应用表现差异

参考文献

  1. Xu D, ZhuX, Ren J, Huang S, Xiao Z, Jiang H, Tan Y. Quantitative proteomic analysis ofcervical cancer based on TMT-labeled quantitative proteomics. J Proteomics. 2022 Feb 10;252:104453. doi: 10.1016/j.jprot.2021.104453. Epub 2021 Dec 13.PMID: 34915198.
  2.  Brenes A, Hukelmann J, Bensaddek D, Lamond AI. Multibatch TMT Reveals False Positives, Batch Effects and Missing Values. Mol Cell Proteomics. 2019Oct;18(10):1967-1980. doi: 10.1074/mcp.RA119.001472. Epub 2019 Jul 22. PMID:31332098; PMCID: PMC6773557.
  3.  O'ConnellJD, Paulo JA, O'Brien JJ, Gygi SP. Proteome-Wide Evaluation of Two Common Protein Quantification Methods. J Proteome Res. 2018 May 4;17(5):1934-1942.doi: 10.1021/acs.jproteome.8b00016. Epub 2018 Apr 19. PMID: 29635916; PMCID:PMC5984592.
  4. Singh LK, PandeyM, Baithalu RK, Fernandes A, Ali SA, Jaiswal L, Pannu S, Neeraj, Mohanty TK,Kumaresan A, Datta TK, Kumar S, Mohanty AK. Comparative Proteome Profiling of Saliva Between Estrus and Non-Estrus Stages by Employing Label-FreeQuantitation (LFQ) and Tandem Mass Tag (TMT)-LC-MS/MS Analysis: An Approach for Estrus Biomarker Identification in Bubalus bubalis. Front Genet. 2022 May13;13:867909. doi: 10.3389/fgene.2022.867909. PMID: 35754844; PMCID:PMC9217162.
  5. Pimienta G,Heithoff DM, Rosa-Campos A, Tran M, Esko JD, Mahan MJ, Marth JD, Smith JW. Plasma Proteome Signature of Sepsis: a Functionally Connected Protein Network. Proteomics. 2019 Mar;19(5):e1800389. doi: 10.1002/pmic.201800389. Epub 2019 Feb20. PMID: 30706660; PMCID: PMC6447370.
  6.  Muntel J, Kirkpatrick J, Bruderer R, Huang T, Vitek O, Ori A, Reiter L. Comparison of Protein Quantification in a Complex Background by DIA and TMT Workflows with Fixed Instrument Time. J Proteome Res. 2019 Mar 1;18(3):1340-1351. doi:10.1021/acs.jproteome.8b00898. Epub 2019 Feb 20. PMID: 30726097.
  7. Lou R, CaoY, Li S, Lang X, Li Y, Zhang Y, Shui W. Benchmarking commonly used softwaresuites and analysis workflows for DIA proteomics and phosphoproteomics. NatCommun. 2023 Jan 6;14(1):94. doi: 10.1038/s41467-022-35740-1. PMID: 36609502;PMCID: PMC9822986.