叮~科学研究必备十八种蛋代数据库,小鹿已全部整理完毕!

2022-06-12 10:27:24, 多层组学定制服务 上海欧易生物医学科技有限公司



生物学领域有很多数据库,这些数据库既是那些领域研究积累的成果,也是后来者往更深入研究的基石,所以每个数据库都可以算是一个巨人的肩膀。而且,即便是生物学领域以外的药物、医学、食品科学,也都已经从这些数据库受益了,比如像DNA的数据库、RNA的数据库、代谢物的数据库和蛋白质数据库。


今天小鹿给大家总结了18种蛋白代谢数据库~觉得好用的小伙伴多多转发关注哦~


蛋白组学:

蛋白质组学产生于20世纪90年代,是以生物体的全部或部分蛋白为研究对象,研究一个生物、一个细胞(组织)或基因组的蛋白质的变化规律的一门学科。蛋白质组学能够在整体水平上研究蛋白质的表达、调控的水平和规律,目的是了解蛋白质间的联系与相互作用,为生命活动规律提供理论和物质基础,为人类的健康带来理论依据和解决方案。


1

UniProt


网址:http://www.uniprot.org/


简介:UniProt是蛋白质方面信息全面、使用频率高、冗余度低的蛋白数据库,可免费获取高质量的蛋白序列和功能信息。数据库由Swiss-Prot(瑞士生物信息研究所)、TrEMBL(欧洲生物信息研究所)和PIR-PSD(蛋白信息资源)三大数据库的数据整合而成。其数据主要来自于基因组测序项目完成后获得的蛋白质序列,并包含了大量来自文献和人工注释的蛋白质的生物功能的信息。


数据库功能模块主要包含:蛋白序列、结构域、亚细胞定位、翻译后修饰,表达情况,蛋白互作等,可以与其他数据库如三维结构数据库、2-D凝聚电泳数据库、蛋白质家族数据库数据共享,可以查找蛋白序列、功能信息、结构域、修饰位点。



2

InterPro


网址:http://www.ebi.ac.uk/interpro/


简介:InterPro是一个蛋白质综合数据库,整合了蛋白质结构域、蛋白质家族、功能位点,结合位点等信息。Interpro在整合多个数据库的同时,去掉了冗余,提供了一个统一的接口,用来对序列进行功能注释,每两个月会更新一次。



3

CDD (Conserved Domain Database)


网址:

http://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml


简介:CDD是蛋白质保守结构域数据库,收集了大量保守结构域序列信息和蛋白质序列信息。一个蛋白质的保守结构域在一定程度上体现了该蛋白质的功能,检索时通过CD-Search服务,可获得蛋白质序列中所含的保守结构域信息,从而分析、预测该蛋白质的功能。



4

IUPHAR-DB


网址:

https://www.guidetopharmacology.org/


简介:IUPHAR-DB为G蛋白偶联受体、离子通道数据库,提供这些蛋白的基因、功能、结构、配体、表达图谱、信号转导机制、多样性等数据。可以用于药物靶点查找,可以按照免疫过程信号通路查询或者在不同细胞特异表达查询或者根据蛋白是激酶、离子通道分类进行查询。



5

SWISS-2DPAGE


网址:http://www.expasy.org/ch2d/


简介:SWISS-2DPAGE收录各种双向电泳或SDS的电泳图,并提供蛋白在电泳图中的位置及其信息,包括人类、小鼠、大肠杆菌、酿酒酵母、盘基网柄菌等。



6

IPSA


网址:

http://www.interactivepeptidespectralannotator.com/PeptideAnnotator.html


简介:IPSA是一个在线的质谱可视化平台,可以通过导入数据及填写相关方法信息,生成可交互的图形。



7

utils


网址:https://ms-utils.org


简介:utils是一个整理了质谱常用软件、网站及数据库的网站。包含质谱常用软件,数据可视化,格式转换,峰提取/反卷积,PTM,蛋白质鉴定,蛋白质定量,蛋白结构,质谱成像,同位素分析计算等相关资源链接,目前也仍在保持更新。


8

BRENDA (enzyme database)


网址:http://www.brenda-enzymes.org


简介:BRENDA是一个酶数据库,提供酶的分类、命名法、生化反应、专一性、结构、细胞定位、提取方法、文献、应用与改造及相关疾病的数据。该数据库主要基于文献,主要部分包含来自约13000种生物的约9万种酶的500万条数据,是从约15.7万种主要参考文献中手动提取的。可用于酶-配体相互作用和酶数据可视化。



9

 GO (gene ontology)


网址:http://geneontology.org/


简介:GO(Gene Ontology)是基因本体联合会(Gene Ontology Consortium)所建立的数据库,旨在建立一个适用于各种物种的,对基因和蛋白功能进行限定和描述的,并能随着研究不断深入而更新的语义词汇标准。GO数据库总共有三大类,分别是生物学过程(Biological Process, BP)、细胞定位(Cellular Component, CC)和分子功能(Molecular Function, MF),各自描述了基因产物可能行使的分子功能,所处的细胞环境,以及参与的生物学过程。


GO数据库中一个基本的概念是节点(term),每个节点都有一个名称,比如“Cell”、“Fibroblast Growth Factor Receptor Binding”或者“Signal Transduction”,同时有一个唯一的编号,如“GO:nnnnnnn”。通过GO数据库注释信息,可对蛋白质进行功能分类注释。



10

KEGG (Kyoto encyclopedia of Genes and Genomes)


网址:https://www.genome.jp/kegg/


简介:KEGG是一个集成数据库,大致由系统信息、基因组信息、化学信息和健康信息四大类组成,可细分为15个主要的数据库。整合了基因组、化学分子和生化系统等方面的数据,包括代谢通路(PATHWAY)、药物(DRUG)、疾病(DISEASE)、基因序列(GENES)及基因组(GENOME)等。可以系统分析基因产物在细胞中的代谢途径以及这些基因产物的功能,有助于把基因及表达信息作为一个整体的网络进行研究。


PATHWAY是其最核心的数据库之一,该数据库是一个手工画的代谢通路的集合,包含分子间相互作用和反应网络,可以用于对蛋白参与的代谢通路进行注释和分析。



11

 Reactome


网址:http://www.reactome.org


简介:Reactome数据库是一个整合了人体生命活动途径和过程的数据库,包含细胞代谢和信号通路,同时对每条通路会提供深入的注解和文献。数据以人类相关数据为主,同时也含有其他二十多种物种的数据。数据库中包含生化过程网络图,其中参与的蛋白分子会有详细注释,为人们提供了一个全新的从整体水平上对生物学途径进行研究的工具。


该数据库由专家撰写,经同行评阅,Pathway注释由生物学专家与Reactome编辑人员合作编写,并交叉引用许多生物信息学数据库,包括NCBI Gene数据库,Ensembl和 UniProt数据库,UCSC基因组浏览器,KEGG化合物和ChEBI小分子数据库,PubMed和 Gene Ontology。



12

STRING


网址:https://string-db.org


简介:string是一个基因、蛋白质相互作用关系检索工具。它可以用于获取独特的,覆盖范围广的实验以及预测的蛋白相互作用关系。用户可以通过蛋白名称或者序列进行查询,结果以可点击互动的网络图展示。


数据库的信息主要来自于提取文献实验数据中的蛋白互作关系以及计算机预测的相互作用关系。提供的相互作用关系主要基于confidence score(可靠指数),以及其他附属信息,比如提供蛋白质域和3D结构。string也是目前蛋白互作数据库中覆盖物种最多,相互作用信息最大的一个。



代谢组学:

代谢组是指某一生物或细胞、组织在一特定生理时期内所有的低分子量代谢产物的集合,主要是指分子量小1000 Da的内源性小分子。


根据不同的理化属性可以将代谢组学所包含的物质主要分为氨基酸类(amino acid)、肽类(peptide)、碳水化合物类(carbohydrate)、能量类(energy)、脂类(lipid)、核苷酸(nucleotide)、维生素和辅助因子(cofactors andvitamins)及外源化合物(xenobiotics)。


面对种类如此繁多复杂的物质,代谢物鉴定成为代谢组学研究的重点,也是目前最主要的技术瓶颈。


1

HMDB


网址:http://www.hmdb.ca/


简介:HMDB于2007年首次发布,是全面的特定生物体代谢组学数据库。该数据库包含或链接三种数据:化学数据、临床数据和分子生物学/生物化学数据。数据库中含有114162个代谢物条目,包括水溶性和脂溶性代谢物,以及被视为丰富(> 1 uM)或相对稀有(<1 nM)的代谢物,涉及25770个代谢途径、18192个代谢反应。



2

METLIN 


网址:https://metlin.scripps.edu/


简介:METLIN起源于表征已知代谢物的数据库,目前已扩展为用于鉴定已知和未知代谢物及其他化学实体的技术平台。该数据库超过一百万个分子,包括脂质、氨基酸、碳水化合物、毒素、小肽和天然产物等。


METLIN的高分辨率串联质谱(MS/MS)数据库来自于标准品及其标记的稳定同位素类似物生成的数据,在鉴定代谢物过程中起着关键作用。并且METLIN可通过MS/MS数据和片段相似度搜索功能识别未知代谢物。



3

MassBank 


网址:http://www.massbank.jp/


简介:一个高质量质谱数据库,旨在公开分享从代谢物的化学标准品得到的质谱图以方便用户进行代谢物的鉴定。MassBank包含了代谢物的质谱信息以及采集情况,这些信息来自于不同的质谱仪设置,包括不同的电离技术例如ESI(60%,占总数据量的百分比)、EI(31%)、CI(2%)、APCI(1.6%)以及MALDI。



4

MetaboLights


网址:https://www.ebi.ac.uk/metabolights/


简介:代谢组学实验和衍生物信息的数据库,该数据库包含了不同物种、不同技术的数据,涵盖了代谢物结构、参考光谱、生物学作用、位置和浓度,以及代谢实验数据。



5

Metabolomics Workbench


网址:www.metabolomicsworkbench.org/


简介:跨各种物种、实验平台、代谢物标准品、代谢物结构和其它资源。它提供了一个计算平台,可以集成、分析、跟踪、存放和传播来自各种代谢组学研究的大量异构数据,包括质谱(MS)和核磁共振谱(NMR)数据,涵盖20多种不同物种,主要类别包括人类、哺乳动物、植物、昆虫、无脊椎动物和微生物。此外,还提供了一系列基于MS和NMR的代谢物类别、样品类型研究方案,以及代谢物结构数据库。



6

KEGG


网址:

https://www.genome.jp/kegg/ligand.html


简介:东京基因及基因组百科全书,在分子和更高水平上为基因和基因组分配功能性含义是KEGG数据库项目的主要目标。


全书收录了生物的所有代谢物的代谢途径,支持对代谢网络的搜寻及代谢途径的映射。与代谢组学相关性大的几个模块包括:KEGG PATHWAY,KEGG DISEASA,KEGG COMPOUND , KEGG REACTION。



.

文末看点lumingbio

上海鹿明生物科技有限公司多年来,一直专注于生命科学和生命技术领域,是国内早期开展以蛋白组学和代谢组学为基础的多层组学整合实验与分析的团队。目前在多层组学研究已经有了成熟的技术方法,欢迎各位老师前来咨询哦~

同时,鹿明生物B站上线了5大频道板块,分别在空间代谢组学、生信分析、多层组学、代谢组学方向为各位科研老师提供有效的方法工具和思路~其中,生信板块也拥有着观看量1.5万的生信爆款视频~欢迎各位老师访问,鹿明生物B站:

https://space.bilibili.com/388691543

长按扫码咨询鹿明生物技术工程师


猜你还想看


1、干货 | 人类代谢数据库(HMDB)使用指南来啦!

2、蛋白互作分析 | String网站使用方法简介

3、单细胞蛋白质组学——集成微流控芯片与DIA质谱技术于一体

4、用一个蛋白叩开uniprot的大门——uniprot入门手册


END

家凯老师|撰文

欢迎转发到朋友圈

本文系鹿明生物原创

转载请注明本文转自鹿明生物

我知道你在看

点击“阅读原文”了解更多


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2023 ANTPEDIA, All Rights Reserved