QuantPipe:基于 OpenSWATH-PyProphet-TRIC 的用户友好型流程软件工具
阅读:1348 时间:2023-01-09

 

前言

 

今天带来一篇发表在Journal of Proteome Research ( IF 4.466 ) 上的方法学文章,文章介绍了一款针对 DIA 数据进行分析的工具QuantPipe。

 

数据非依赖性采集模式 (DIA) 的质谱采集方式结合了蛋白质组深度覆盖能力与定量一致性和准确性。由于DIA模式产生的碎片离子丢失了母离子及子离子的对应关系,谱图过于复杂,DIA数据的结果分析需要参考谱图库。OpenSWATH-PyProphet-TRIC是一个完整且强大的开源 DIA 数据分析工作流程,可以对大规模 DIA 数据集进行高效分析,并对定量结果进行严格的统计控制。但该工作流程通过命令行实现,这对于无生物信息学背景的研究人员来说具有挑战性。 

 

QuantPipe可提供图形界面,允许用户自动执行、监控 OpenSWATH-PyProphet-TRIC 工作流程并获得蛋白质和肽段的定量结果。本文展示了QuantPipe分析SWATH-MS数据(TripleTOF 5600和6600)、磷酸化 SWATH-MS数据(TripleTOF 5600)、DIA 数据(Orbitrap Fusion Lumos)、 diaPASEF 数据(TimsTOF Pro)以及人血浆 SWATH-MS 数据的功能。该工具由厦门大学钟传奇博士团队和谱度众合(武汉)生命科技有限公司合作开发完成,并申请了名为“一种异构数据不依赖型蛋白质组学质谱分析系统及方法”的发明专利。

 

 

 

 

 

人物介绍 

 

钟传奇  原文通讯作者

 

钟传奇,男,博士,厦门大学生命科学学院副教授。现从事的是基于蛋白质组学的生物信号通路研究。至2021年10月,已经发表29篇SCI论文,其中以独立通讯作者或共同通讯作者发表8篇论文,累计被引用次数为2464次,H指数为14,其中引用率最高的文章为915次。在2015年,钟传奇博士以共同通讯作者身份在世界顶级学术杂志“Nature Methods”上发表论文,发明了一种创新的蛋白质组数据处理软件,解决了蛋白质组学领域内的一大难题。

 


 

陈希  原文共同作者

 

博士,高级工程师,毕业于武汉大学生命科学学院,在校期间搭建了武汉大学第一个生物质谱平台,从事蛋白质组学研究工作。毕业后前往香港大学任职助理研究员。2013年,加入武汉生物技术研究院,创建了光谷生物城第一个蛋白质组学平台,负责平台的技术及管理运营,同时作为武汉生物技术研究院建院以来的第一个博士后,进行深造。2018年,创办了谱度众合(武汉)生命科技有限公司,担任公司总经理,从事:(1)临床蛋白质组学科技服务、(2)体外诊断试剂盒研发。目前,公司已获批国家高新技术企业及武汉市科技“小巨人”企业。陈希博士在蛋白质组学领域拥有16年的科研和市场经验,发表SCI论文40余篇,申请国家发明专利10项,实用新型专利8项,软件著作权10项,并主持:(1)国家自然科学基金青年基金、(2)湖北省博士后创新岗位基金、(3)武汉市博士后科研启动基金。陈希博士先后荣获:(1)中国人社部颁发的“中国留学人员回国创业启动支持计划”;(2)湖北省人社厅颁发的“湖北省企业研发人才”;(3)东湖高新区颁发的“优质高端创业项目”;(4)东湖高新区颁发的“3551光谷创业人才”。

 


 

 

概览 

 

 

 

 

QuantPipe 为使用者提供图形界面,方便对参数进行设置,例如iRT文件的位置、谱图库文件、隔离窗口文件和DIA文件(mzXML和mzML)。OpenSWATH-PyProphet-TRIC工作流程的参数修改也很简易,整个流程分为四步:从splib或blib文件生成谱图库、OpenSWATH的峰值拾取和评分、PyProphet 的统计验证、TRIC 的多轮比对以及肽段和蛋白质强度的输出。

 

导入文件并对参数进行设置后,QuantPipe 可以自动顺序执行整个流程中的每个操作。

 

 

结果一:使用 QuantPipe 分析 SWATH-MS 数据

 

TripleTOF 5600:作者将大肠杆菌 β-半乳糖苷酶肽(BG)加入293T细胞裂解物中进行消化,随后在 TripleTOF 5600上以SWATH-MS模式测量。

 

人工检测方法是SWATH-MS 数据定量分析中的金标准。作者选择具有代表性的 BG 肽段VDEDQPFPAVPK 并使用Peakview软件人工提取其子离子峰面积,与QuantPipe的定量性能进行对比。

 

结果表明,QuantPipe与人工检测结果的定量准确性类似。

 

 

 

 

 

TripleTOF 6600:作者采取两个混合蛋白质组样本(其中蛋白质组来源及比例为人类蛋白质组1:1、酵母2:1、大肠杆菌1:4 )在TripleTOF 5600上以 SWATH-MS 模式测量。QuantPipe的分析结果与原版OpenSWATH报告的蛋白质数目和肽段数目非常接近。在所有的肽段和蛋白鉴定结果中,有90%的肽段和94%的蛋白质是在2种方法中均被鉴定到的。

 

结果表明OpenSWATH (QuantPipe) 和原版OpenSWATH的识别性能几乎相同。

 

 

 

 

结果二:使用 QuantPipe 分析 DIA数据

 

作者比较了QuantPipe和Spectronaut使用无需DDA建立谱图数据库的方法分析DIA数据的效果。Spectronaut使用directDIA算法分析DIA数据,定量到4549种蛋白质,其中96%可被QuantPipe鉴定到。QuantPipt使用DIA-Umpire结合Open SWATH的算法分析DIA数据,其中仅由QuantPipe鉴定到的919 种蛋白质中,63% 可以在Spectronaut中以基于DDA谱图库的方法检测到,这表明这些蛋白质不是假阳性鉴定。两种方法的蛋白质强度绝对值不同,但两种方法产生的蛋白质强度具有良好的相关性。

 

这些结果表明,基于OpenSWATH的QuantPipe和Spectronaut的在DIA数据中的蛋白鉴定和定量能力相当。

 

 

 

 

 

结果三:使用 QuantPipe 分析 diaPASEF 数据

 

作者使用timsTOF Pro质谱仪以ddaPASEF和diaPASEF的方法分析了100 ng Hela 肽段,测试了QuantPipe分析包含离子淌度信息的质谱数据的效果。

 

使用MSFragger对ddaPASEF结果进行搜库,使用Skyline以1% FDR水平生成谱图库 (blib) ,其中包含45214个肽段和5207个蛋白质。用户可以使用QuantPipe中的Lib2tsv工具将blib文件格式转换成tsv文件格式,和profile mzML文件一起通过QuantPipe输入mobi-DIK(离子淌度DIA工具包),以便对diaPASEF数据进行mobi-DIK分析。

 

在 QuantPipe中启用离子淌度,在1% 的 FDR水平可以增加25%的肽段和17%蛋白质的鉴定。3次重复检测实验中,Pearson相关系数在肽段水平为0.79-0.87,在蛋白质水平为0.93-0.95。

 

 

 

 

 

结果四:使用QuantPipe分析Phospho-SWATH-MS数据

 

作者使用Comet和X!tandem对之前研究中的12个DDA数据文件进行搜库,并构建了谱图库,其中包括6773个磷酸化肽段(PTMProphet probability > 0.7)。通过Open SWATH - PyProphet - TRIC工作流程鉴定了5292种磷酸化肽段和2775 种磷酸化位点特异性肽段。

 

QuantPipe界面中只需勾选对话框中的IPF即可采用IPF肽型预测(Inference of PeptidoForms)算法,降低磷酸化修饰位点鉴定的错误率。

 

 

 

 

 

结果五:使用 QuantPipe 分析大规模 SWATH-MS 数据

 

基于质谱的自动化流程能够对临床研究领域生物样品进行高通量分析。作者使用QuantPipe分析包含91次SWATH-MS运行的使用超快5分钟液相色谱梯度获得的大规模人体血浆数据集。使用DIA-Umpire分析了91次DIA检测获得的数据,使用MSFragger通过SpectraST算法构建了包含159个蛋白质和2643个肽段的谱图数据库。基于该谱图库,使用QuantPipe分析,定量到137种蛋白质,而DIA-NN软件基于相同的谱图库定量到133种蛋白质。

 

这些结果表明,QuantPipe可用于大规模DIA数据的靶向分析。

 

 

 

 

 

总结

 

基于谱图库的DIA靶向分析是DIA研究的主流策略。目前,Spectronaut、Skyline和DIA-NN均可以对DIA数据进行分析,但这些工具也各有局限。Spectronaut是商业化的收费软件,Skyline仅能在肽段层面而非蛋白层面进行错误控制,DIA-NN则对不同厂商仪器来源的DIA数据格式支持程度尚不十分完全。因此OpenSWATH-PyProphet-TRIC是目前可免费访问、严格的统计错误控制以及不依赖于仪器厂商DIA数据类型的最强大的DIA数据分析流程。QuantPipe是基于OpenSWATH-PyProphet-TRIC工作流程的图形界面软件,并且除了OpenSWATH-PyProphet-TRIC工作流程提供的功能外,QuantPipe还具有“处理Skyline生成的谱图库”和“生成蛋白定量信号强度”等各种其他功能。

 

本文展示了QuantPipe对多种仪器来源的多种DIA数据的分析效果,结果表明,QuantPipe 是一种功能强大,简单易用的自动化DIA数据分析工具。