01 介绍
一般蛋白质组学数据用于文章发表时,杂志会要求上传质谱数据至公共数据库,供同行下载和分析。ProteomeXchange是目前使用最多的蛋白质组学数据储存平台。ProteomeXchange旗下的成员包括PRIDE (EMBL-EBI, Cambridge, UK),PeptideAtlas (ISB, Seattle, WA, USA),MassIVE (UCSD, San Diego, CA, USA),jPOST (various institutions, Japan),iProX (National Center for Protein Sciences, Beijing, China),Panorama Public (University of Washington, Seattle, WA, USA)。
图片来自ProteomeXchange官网
http://www.proteomexchange.org/
其中iProX的服务器在中国,国内的研究者可选择iProX上传蛋白质组学数据,速度相对较快。下面以iProX为例展示数据上传流程,其他平台上传方式类似。
02 上传前准备
1)iProX账号;
2)蛋白质组学数据,包括:
· 质谱下机原始数据文件(如.raw/.wiff和.wiff.scan/.d等);
· 软件检索结果。
3)项目相关信息:
· Project Title
· Project Tag (key words)
· Project Description
· Institution
· Submitter: Name/Email/Institution
· Lab Head
· Access Level: Public/Plan to public(需提供公开日期)/Privite 三选一
· Experiment Protocol: (可摘取manuscript中方法的相应部分)
· Informatics Protocol: (可摘取manuscript中方法的相应部分)
03 数据上传流程
1)注册账号、登录iProX;
访问iProX网站(www.iprox.org),点击网页右上角“Register”,按要求填写信息,注册账号。完成账号注册后,点击“Sign in”登录。
2)新建项目:
通过网页正上方Submit -> New Project创建新项目,按照上述准备的内容填写项目相关信息。点击网页底部Continue保存当前填写信息进入下一步。
3)新建子项目:
创建子项目,填写子项目相关信息。需要注意的是,Experiment Protocol和Informatics Protocol虽然没有加“*”,但也必须填写,不然无法通过审核。还有其他项目,比如Species, Disease, Quantification, Digestion, PTM, Experiment Type等信息,建议大家跟自己项目符合的都填一下,这样同行可以更清楚地了解我们的数据,以便重复或者重新分析这些质谱数据。点击Continue保存当前信息并进入下一步。
4)上传数据文件:
iProX支持两种数据提交方式:Complete submission和Partial submission。Complete submission要求上传标准格式的原始数据文件和结果文件;Partial submission也要求原始数据文件和结果文件,但是对文件的类型不作要求。实际使用中,Partial submission用得比较多。
(iProX两种数据提交方式支持的文件类型)
上传数据时,首先选择数据提交方式(Complete submission或Partial submission)和提交途径(Upload by Browser或Upload by Aspera);然后点击“+Add file”,选择需要上传的数据文件;文件的file type和Source/result file可根据情况进行调整;点击“Start upload”开始上传数据。
5)提交:
数据上传完成后,点击“Continue”,选择项目和子项目,点击Submit提交数据。iProX官方管理员会进行审核,审核结果通过邮件和站内信的方式进行通知。
注意:Submit成功时,Project status和Subproject status显示状态会立刻从Save变为Check,然后再变为Submit,并在Show log中记录提交时间。ProteomeXchange ID也会随后给出。
6)数据分享、查看iProX和PXD号:
如果需要分享iProX中的数据供审稿人查阅,可选择相应的Project后,点击“Share”按钮后,生成一个含有密码的链接,发给对方即可。
文章中需要提供质谱原始数据时,可将iProX ID(IPX号)或者ProteomeXchange ID(PXD号)列出即可。例如,可参考如下表述:
The MS data have been deposited to the ProteomeXchange Consortium via the iProX repository with the data set identifier PXD#######.
04 参考信息
1)ProteomeXchange. http://www.proteomexchange.org/
2)User Manual for iProX. https://www.iprox.cn/page/helpEn.html