干货分享:蛋白组学原始数据如何上传?

2022-12-05 10:18:09, 西湖欧米wOmics 西湖欧米(杭州)生物科技有限公司


近期有不少客户咨询和反馈,说发文章的时候,蛋白组学的原始数据该如何上传?上传到什么平台呢?

那么今天我们就一起来细数目前主流的蛋白组学原始数据上传平台,并提供具体的上传路径供各位老师参考。

  概述  

我们先说说为什么要上传蛋白组学原始数据到公共平台。一是方便学术界进行数据成果的存储和共享;二是投稿的时候不需要单独再上传海量数据给期刊,文章中标注在公共平台的数据项目ID就行。因此,选择一个公认和可靠的数据公共平台是非常有必要的。

目前,最主流的蛋白组学数据公共平台是 ProteomeXchange,是European Molecular Biology Laboratory(EMBL)旗下的一个专门储存蛋白组数据的公共平台,也是目前收录蛋白组数据集最多的平台。同时,为了国际间蛋白组数据的更好共享,ProteomeXchange 联盟吸纳了全球多个蛋白组学数据存储和共享平台(图1),目前包括:PRIDE(EMBL-EBI,剑桥,英国),PeptideAtlas(ISB,西雅图,华盛顿州,美国),MassIVE(UCSD,圣地亚哥,加利福尼亚州,美国),jPOST(多机构,日本),iProX(国家蛋白质科学中心,北京,中国)和 Panorama Public(华盛顿大学,西雅图,华盛顿州,美国)”。

图1. ProteomeXchange 联盟成员全球分布图

那么,这么多数据公共平台该如何选择呢?
目前国际上用的比较多的是 PRIDE。但近年来大家都知道如果涉及人类遗传学数据是不允许上传到国外平台的,那么 iProX 则是国内学者最好的选择。iProX 是中国的综合性蛋白质组资源中心,提交系统是在 ProteomeXchange 联盟制定的数据共享政策的指导下建立的,因此国际上也是非常认可的。我们从下图 iProX 网站的统计数据可以看到目前平台收录的数据集已经比较多了。同时,iProX 网站可进行中英文双语切换,加上服务器在国内,上传速度比较快,非常适合国内学者。接下来我们一起看下利用 iProX 进行蛋白组原始数据提交的详细流程。
图2. iProX 网站主页界面

 iProx 数据提交流程 


Step.1

注册账号并创建项目

注册账号并通过邮件激活后,我们可以点击网页菜单栏【项目】-【创建项目】。

图3. iProX 网页主菜单界面

Step.2

项目信息填写

进入创建项目窗口后,根据指引填写项目相关信息。这里有一个需要注意的地方是,访问权限的下拉菜单可以选择三种方式。

  • Public:即刻就公开;

  • To be public:自定义公开的时间;

  • Private:暂不公开。

不过,当你的文章发表后,该项目的数据会自动面向公众发布。

图4. iProX 网页中数据公开形式的选择界面

Step.3

子项目信息填写

子项目信息填写的内容主要针对具体蛋白组学实验中的一些信息,如物种类型、组织类型、疾病类型、定量方法、使用的质谱仪器等。这里按照项目的实际情况填写就可以。

Step.4

数据上传和提交

(1)iProX目前提供两种数据提交的形式:Complete submission(完整提交)和Partial submission (部分提交)。Complete submission对提交的数据格式有要求,Partial submission则适合所有的数据上传,不过Partial submission由于数据格式的问题会明显降低数据的可见度和重复利用度。

表1. iProX 数据提交方式和文件格式要求

数据提交形式

文件类型

文件格式

Complete submission

RESULT

prideXML、mzldentML(需要有对应的 PEAK 文件)

RAW

质谱仪产出的原始文件

Partial submission

SEARCH

搜索得到的结果文件

RAW

质谱仪器产生的原始文件

说明:如果选择 Complete submission,RESULT 文件中必须有 prideXML 或 mzldentML 中的一种,并且如果是 mzldentML 文件还需要有对应的 PEAK 文件。

(2)iProX上传的方式有网页上传(Uploud by Browse)和Aspera插件上传(Upload by Aspera)两种。网页上传文件大小不能超过4Gb,因此更多的情况下都是通过 Aspera 上传数据文件。
选择好数据提交的形式和上传方式后,点击“Add file”将准备好的项目数据文件上传,上传中系统会根据文件后缀自动判断文件类型。上传完成并提交后,通过 iProX 管理员的审核就可以获得 iProX 编号。有了编号就可以直接在文章中标识原始数据的访问信息,一般在致谢后的“DataAvailability”部分进行标注。

图5. iProX 数据上传界面

Step.5

附件信息

表2. ProteomeXchange 资源的提交指南摘要以及所涉及的提交类型



如果想进一步了解或使用相关数据库平台,可以访问相关网站:

iProX: http://www.iprox.org/;

ProteomeXchange: http://www.proteomexchange.org;

PRIDE: http://www.ebi.ac.uk/pride;

PeptideAtlas: http://www.peptideatlas.org/;

PASSEL: http://www.peptideatlas.org/passel/;

MassIVE: https://massive.ucsd.edu/;

jPOST: https://jpostdb.org/;

Panorama Public: https://panoramaweb.org/public.url。

整体来说,蛋白组学原始数据上传还是很便捷的。感谢这些平台给大家提供了这样的数据存储和交流的方式。

西湖欧米科研服务

新品来袭 | ProteomEx空间蛋白质组学

特色膨胀水凝胶特色,以小见大,解析组织异质性

新品发布 | 基于“膨胀”的空间蛋白质组学ProteomEx服务

新品来袭 | 宏蛋白质组学

大批量样本处理优势,千人以上队列研究,自主创新高通量流程

宏蛋白新品发布 | 当“宏”流量解析“微”社区密码

超高深度 | TMT蛋白质组

30Fraction高深度鉴定,优异批次效应处理

独家专利 | Pulse-DIA蛋白质组

脉冲式方法改进,鉴定量提升优异

高深度 | DIA蛋白质组

高性价比,高稳定性,高灵敏度

高深度 | 4D-DIA蛋白质组

超微量样本,高灵敏度

其他科研服务成果介绍:西湖欧米合作文章集锦


西湖欧米创立于2020年7月,是一家专注于AI赋能的蛋白质组大数据公司。我们致力于以技术创新为驱动力,以多模态大数据为基础,使用AI赋能微量临床样本的高通量蛋白质组分析等组学技术辅助精准医学和药物研发。西湖欧米拥有一支专业的团队,有丰富的项目经验,为您的样本保驾护航。

如有意向,欢迎咨询

联系我们 CONTACT US:

邮箱:service@westlakeomics.com

座机:0571-86780630

扫描下方二维码,添加咨询微信


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved