2022多领域数据库大集合，实现高阶蛋白、代谢组学发文强助攻！

2022-12-07 05:35:44, 多层组学定制服务上海欧易生物医学科技有限公司

「编者按」

Luming

上篇小鹿对研究方法思路总结，探究连连频发的代谢组学，如何发表高分文章，进行了精细思路的拆解！！研究方法大起底！连连频发的代谢组学，高分思路精细拆解「可收藏」~

想要发高分文章不仅需要顶刊思路的思维方法，同时与之相匹配的研究工具也是实现顶刊不可或缺的因素之一。＞10分文章的研究思路除了在“新”字可以全面下功夫，另外多组学或者多种技术联合也是众多文章更全面地在该领域解释发现与验证的过程。此时，数据库的使用不得不说在其中也发挥着重要作用。本篇小鹿盘点多领域数据库大合集，为您的高分组学发文强助攻！！

综合性肿瘤数据库
TCGA✬	TCIA✬	ICGC
cBioPortal	canEvolve	UCSC Cancer Genomics Browser

肿瘤转录组数据库
Oncomine✬	GEO✬	ArrayExpress
ChiTaRS	miRCancer	OncomiRDB
UALCAN	CRN

基因组数据库
Cancer Hotspots✬	BioMuta✬	ArrayMap
Mitelman	SomamiR	CGP

遗传变异数据库
ClinVar✬	dbVar	DECIPHER
DGV	HGVS	EGA
gnomAD	HGMD	MOKCa
RefSeqGene	dbSNP✬	HRC

DNA甲基化数据库
MethHC	MethyCancer	methDB
GSmethDB	PubMeth	SurvivalMeth
DiseaseMeth	MethBank✬	Lnc2Meth
MEXPRESS	EWAS	m6A2Target✬

蛋白组数据库
CPTAC	Cancer3D	InterPro
UniProt✬	STRING✬	PIR
PDB

代谢组学数据库
HMDB✬	METLIN✬	GMD
LIPID MAPS	PubChem	MassBank
NPACT	BiGG

肿瘤驱动基因数据库
CGC✬	Network of Cancer Genes	DriverDB
IARC TP53	OncoKB✬	IntOGen

通路pathway数据库
KEGG✬	Reactome✬	Pathway Commons
innate edb	BioGRID	ConsensusPathDB-human
SMPDB

部分蛋白组学，代谢组学常用经典数据库罗列：

Part1: 蛋白数据库

Vol.1/ uniprot数据库

目前较常用的蛋白质组数据库是UniProt和NCBI这2个公共库，其中UniProt整合了Swiss-Prot、 TrEMBL 和 PIR-PSD 三个数据库，主要优势在于添加了蛋白功能注释信息。具有更新速度快、与其他数据库联系密切、分析工具齐全、使用便捷的特点，成为了目前信息最丰富、资源最广的蛋白质数据库。

一般情况下，如果蛋白质组所研究的物种已经被测序，推荐使用Uniprot数据库作为蛋白搜库匹配的数据库，如果所研究的物种在UniProt数据库中蛋白数据较少，推荐使用NCBI数据库进行搜库。

数据库链接：https://www.uniprot.org/

点击查看：uniprot数据库使用方法

Vol.2/ String数据库

String数据库（https://string-db.org/）是一个搜索已知蛋白质之间和预测蛋白质之间相互作用的数据库，该数据库可应用于五千多个物种，包含两千四百万种蛋白的，大于2000万种蛋白质之间的相互作用连接。

点击查看：蛋白互作分析 | String网站使用方法简介

Vol.3/ PhosphoSitePlus数据库

PhosphoSitePlus数据库是一个由 CST 和 NIH 联合开发的免费资源数据库，总结归纳了海量通过科学研究发现的蛋白修饰位点，包括磷酸化、甲基化、乙酰化、泛素化等，并且包括一些 CST 公司发现但未发表的蛋白修饰位点。

该数据库是动态的、开放的、高度互动并持续更新的。它有助于研究 PTMs 在正常和病理细胞/组织中的作用，同时它也是发现新的疾病标志物和药物靶点的有力工具。

Vol.4/ PDB数据库

国际蛋白质结构数据库(PDB)全称为Protein Data Bank，是全球最主要的收集生物大分子(蛋白质、核酸和糖)2.5维（以二维的形式表示三维的数据）结构的数据库。PDB网址https://www.wwpdb.org/，用户可以经由网络免费访问，是结构生物学研究的重要资源。

PDB主要收集蛋白质的结构信息，也包括了少量的核酸及糖的三维结构。截至目前，该数据库共收录192095个蛋白质/核酸结构，其中人类序列结构57738个，含核酸结构14495个。

Part2 :代谢组学数据库

Vol.1/ HMDB数据库数据库

人类代谢数据库（HMDB，https://hmdb.ca）是最大、最全面的生物体特异性代谢数据库。该数据库包含或链接了三种数据：化学数据、临床数据和分子生物学/生物化学数据。目前，该数据库包含220945个代谢物条目，包括水溶性和脂溶性代谢物。此外，还包含了8610个和这些代谢条目有关的蛋白质序列（酶和转运蛋白）。

点击查看：干货 | 人类代谢数据库（HMDB）使用指南来啦！

Vol.2/ METLIN数据库

METLIN数据库（https://metlin.scripps.edu）是由美国斯克里普斯研究院开发的，是目前最大的二级质谱数据库，这些数据来自多个QTOF质谱检测平台，包括SCIEX、Agilent、Bruker、Waters。METLIN现在拥有超过500,000种分子标准品，具有多种能量和正/负模式的MS/MS数据。

METLIN包含超过一百万个分子，包括脂质、类固醇、小肽、碳水化合物、外源性药物/代谢物、中心碳代谢物和有毒物质等。

由于METLIN网站已商业化，其检索功能在国内无法使用。为了给科研工作者提供更全面更准确的代谢物数据信息，鹿明生物购买了METLIN网站的商业版数据库用于LC-MS/MS非靶代谢组学的代谢物鉴定研究（下图为METLIN数据库官网首页图片）。