用一个蛋白叩开uniprot的大门——uniprot入门手册

2022-05-20 13:52:57, 多组学定制服务 上海欧易生物医学科技有限公司



蛋白质组学研究中,通过对细胞、组织或器官的蛋白质分析鉴定明确蛋白质在不同物种中发挥的功能以及蛋白质间的相互作用关系。而当你仅仅知道一个蛋白质名称的时候,如何才能知道这个蛋白质存在于什么物种的、什么细胞内、它的作用是什么、结构是什么、以及与它有相互作用的蛋白质是哪些?


今天就让我们用一个蛋白打开uniprot的大门,通过Uniprot数据库来剖析一个蛋白吧!


uniprot数据库


uniprot(The Universal Protein Resource)蛋白质数据库(https://www.uniprot.org)是一个整合了EBI(European Bioinformatics Institute),SIB(the Swiss Institute of Bioinformatics),PIR(Protein Information Resource)三大数据库的资源。目前国际上序列数据较完整、注释信息较丰富的蛋白质序列数据库。


以蛋白HLA-A为例,可以通过uniprot数据库查询该蛋白的具体信息,具体步骤为:


1

在搜索框内输入蛋白名,点击Search得出的界面如下(图1)


图1 | 蛋白HLA-A搜索结果


1、为搜索框,可用关键词进行检索,点击搜索框左侧可选取所需的搜寻范围和侧重的搜寻结果。

2、表示序列类型,Swiss-Prot是经过人工注释、审核过的序列,TrEMBL是由核苷酸数据库注释为蛋白质编码区的序列自动翻译而成,未经人工审核。

3、表示筛选条件,可根据物种、关键词等筛选蛋白。

4、为搜寻结果,这一部分可选择自己需要进行编辑保存,之后所选内容便会在搜索结果界面显示(如图2)


图2 | 搜寻结果显示内容设置界面


图3 | BLAST方法


也可将查询到的序列下载到本地,可选择不同的数据类型(图4)


图4 | 搜索结果下载方法


2

对蛋白的详细分析


图5 | 蛋白P04439详细内容页


1、该蛋白的基础信息,具体包括该蛋白的登记信息(蛋白名、基因名、物种、是否经过人工审核、蛋白质相关信息质量评分等)、出版发表的文章信息等。

2、蛋白信息对应的条目名称,可以根据需求选择。

3、条目的详细内容,点击条目名称则会出现对该部分内容的解释(图6)


图6 | 以“Function”为例的条目内容解释


3

研究目的不同便会注重不同的条目,在这里我们重点解释以下几个部分:


1、Function部分描述该蛋白在物种内发挥的功能、活性位点以及其GO三大层面——分子功能(Molecular Function,MF )、细胞组分(Cellular Component ,CC)、生物过程(Biological Process ,BP)的功能等,这一部分主要是生物学知识(图7)


图7 | Function部分具体内容


2、Names & Taxonomy部分提供蛋白名、基因名、NCBI物种分类编码及分类谱系以及该蛋白在其他数据库的ID(图8)


图8 | 蛋白HLA-A搜索结果


3、Subcellular location 可了解该蛋白的亚细胞定位,附带亚细胞结构图,注释该蛋白存在的位置以及GO注释信息(图9)


图9 | Subcellular location 部分具体内容


4、Pathology & Biotech提供与该蛋白质相关的疾病和表型信息,包括与遗传变异相关的疾病信息、发生变异的位点等(图10)


图10 | Pathology & Biotech部分具体内容


5、PTM / Processing这部分内容针对蛋白的氨基酸序列,分析翻译后修饰特征。展现在不同位点的转录后修饰及加工信息,提供了信号肽、二硫键、磷酸化位点等信息。除此之外还提供了其他蛋白质组数据库的链接,可查看质谱实验的结果(图11)


图11 | PTM / Processing部分具体内容


6、Interaction提供有关蛋白质四级结构以及与其他蛋白质或蛋白质复合物相互作用的信息,其中详细描述该蛋白与其他蛋白如何发生作用?在这一部分可关注String数据库提供的数据,可用作蛋白互作网络分析(图12)


图12 | Interaction部分String数据库链接


7、Structure提供有关蛋白质三维结构的图形,可交互操作改变三维结构方向以及大小;而二级结构不同颜色的标注解释了在相应的位点氨基酸序列的形态。


图13 | 蛋白的三维结构图形




图14 | 蛋白的二维结构标注


在这一部分中还提供了蛋白质详细的家族分类、对同源蛋白和系统发生关系进行分析、蛋白质序列、序列的分析工具以及列出该蛋白到其他数据库的链接。每一个部分的使用方法和代表的意义在uniprot中都有完整的解释,我们可以根据需求进行筛选。


Uniprot数据库作为目前世界上序列最多、注释信息最完整的数据库,可以说它不仅为蛋白质的研究提供数据支持,更是为生命科学领域提供了宝贵的资源。本文所讲的知识点在uniprot数据库中仅为沧海一粟,更多有用的知识和技能只有你打开uniprot才能知道。


随着上期鹿明生物推出代谢组学蛋白研究常用数据库 | UniProt数据库介绍及使用说明后,本期的uniprot入门手册希望能助力各位老师蛋白搜库、检索感兴趣的蛋白有所帮助。鹿明生物多年来,一直专注于生命科学和生命技术领域,是国内早期开展以蛋白组学和代谢组学为基础的多层组学整合实验与分析的团队。小鹿后期会持续推出蛋白组学及代谢组学的"库"系类文章,请各位老师持续关注... ...


重大活动关注

空代千万医学支持计划

活动超长周期:

2022.5.09~2022.8.09

深度交流:1v1技术交流探讨课题组,空间代谢组学讲座预约;

针对方向:鹿明生物空间代谢组学

申请方法:只需在线提交800字研究目的、思路及意义;即可参与活动~~

(点击图片即可申请)


猜你还想看


1、干货 | METLIN:一个强大的代谢物鉴定及查询的数据库

2、蛋白研究常用数据库 | UniProt数据库介绍及使用说明

3、百万立项计划 | 突破代谢组学化合物鉴定技术瓶颈:标品库管理背后的故事

4、导师给你推荐了吗?历隔4年,HMDB数据库5.0版强势来袭!


END

kylin|撰文

欢迎转发到朋友圈

本文系鹿明生物原创

转载请注明本文转自鹿明生物

我知道你在看

点击“阅读原文”了解更多


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved