2022多领域数据库大集合,实现高阶蛋白、代谢组学发文强助攻!

2022-12-07 05:35:44, 多层组学定制服务 上海欧易生物医学科技有限公司


「编者按」

Luming

上篇小鹿对研究方法思路总结,探究连连频发的代谢组学,如何发表高分文章,进行了精细思路的拆解!!研究方法大起底!连连频发的代谢组学,高分思路精细拆解「可收藏」~

想要发高分文章不仅需要顶刊思路的思维方法,同时与之相匹配的研究工具也是实现顶刊不可或缺的因素之一。>10分文章的研究思路除了在“新”字可以全面下功夫,另外多组学或者多种技术联合也是众多文章更全面地在该领域解释发现与验证的过程。此时,数据库的使用不得不说在其中也发挥着重要作用。本篇小鹿盘点多领域数据库大合集,为您的高分组学发文强助攻!!

综合性肿瘤数据库

TCGA✬

TCIA✬

ICGC

cBioPortal

canEvolve

UCSC Cancer Genomics Browser

肿瘤转录组数据库

Oncomine✬

GEO✬

ArrayExpress

ChiTaRS

miRCancer

OncomiRDB

UALCAN

CRN

_

基因组数据库

Cancer Hotspots✬

BioMuta✬

ArrayMap

Mitelman

SomamiR

CGP

遗传变异数据库

ClinVar✬

dbVar

DECIPHER

DGV

HGVS

EGA

gnomAD

HGMD

MOKCa

RefSeqGene

dbSNP✬

HRC

DNA甲基化数据库

MethHC

MethyCancer

methDB

GSmethDB

PubMeth

SurvivalMeth

DiseaseMeth

MethBank✬

Lnc2Meth

MEXPRESS

EWAS

m6A2Target✬

蛋白组数据库

CPTAC

Cancer3D

InterPro

UniProt✬

STRING✬

PIR

PDB

__

代谢组学数据库

HMDB✬

METLIN✬

GMD

LIPID MAPS

PubChem

MassBank

NPACT

BiGG

_

肿瘤驱动基因数据库

CGC✬

Network of Cancer Genes

DriverDB

IARC TP53

OncoKB✬

IntOGen

通路pathway数据库

KEGG✬

Reactome✬

Pathway Commons

innate edb

BioGRID

ConsensusPathDB-human

SMPDB

__

部分蛋白组学,代谢组学常用经典数据库罗列:

Part1:  蛋白数据库

Vol.1/  uniprot数据库

目前较常用的蛋白质组数据库是UniProt和NCBI这2个公共库,其中UniProt整合了Swiss-Prot、 TrEMBL 和 PIR-PSD 三个数据库,主要优势在于添加了蛋白功能注释信息。具有更新速度快、与其他数据库联系密切、分析工具齐全、使用便捷的特点,成为了目前信息最丰富、资源最广的蛋白质数据库。

一般情况下,如果蛋白质组所研究的物种已经被测序,推荐使用Uniprot数据库作为蛋白搜库匹配的数据库,如果所研究的物种在UniProt数据库中蛋白数据较少,推荐使用NCBI数据库进行搜库。

数据库链接:https://www.uniprot.org/

Vol.2/  String数据库

String数据库(https://string-db.org/)是一个搜索已知蛋白质之间和预测蛋白质之间相互作用的数据库,该数据库可应用于五千多个物种,包含两千四百万种蛋白的,大于2000万种蛋白质之间的相互作用连接。

Vol.3/  PhosphoSitePlus数据库

PhosphoSitePlus数据库是一个由 CST 和 NIH 联合开发的免费资源数据库,总结归纳了海量通过科学研究发现的蛋白修饰位点,包括磷酸化、甲基化、乙酰化、泛素化等,并且包括一些 CST 公司发现但未发表的蛋白修饰位点。

该数据库是动态的、开放的、高度互动并持续更新的。它有助于研究 PTMs 在正常和病理细胞/组织中的作用,同时它也是发现新的疾病标志物和药物靶点的有力工具。

Vol.4/  PDB数据库

国际蛋白质结构数据库(PDB)全称为Protein Data Bank,是全球最主要的收集生物大分子(蛋白质、核酸和糖)2.5维(以二维的形式表示三维的数据)结构的数据库。PDB网址https://www.wwpdb.org/,用户可以经由网络免费访问,是结构生物学研究的重要资源。

PDB主要收集蛋白质的结构信息,也包括了少量的核酸及糖的三维结构。截至目前,该数据库共收录192095个蛋白质/核酸结构,其中人类序列结构57738个,含核酸结构14495个。

Part2 :代谢组学数据库

Vol.1/  HMDB数据库数据库

人类代谢数据库(HMDB,https://hmdb.ca)是最大、最全面的生物体特异性代谢数据库。该数据库包含或链接了三种数据:化学数据、临床数据和分子生物学/生物化学数据。目前,该数据库包含220945个代谢物条目,包括水溶性和脂溶性代谢物。此外,还包含了8610个和这些代谢条目有关的蛋白质序列(酶和转运蛋白)。

Vol.2/  METLIN数据库

METLIN数据库(https://metlin.scripps.edu)是由美国斯克里普斯研究院开发的,是目前最大的二级质谱数据库,这些数据来自多个QTOF质谱检测平台,包括SCIEX、Agilent、Bruker、Waters。METLIN现在拥有超过500,000种分子标准品,具有多种能量和正/负模式的MS/MS数据。

METLIN包含超过一百万个分子,包括脂质、类固醇、小肽、碳水化合物、外源性药物/代谢物、中心碳代谢物和有毒物质等。

由于METLIN网站已商业化,其检索功能在国内无法使用。为了给科研工作者提供更全面更准确的代谢物数据信息,鹿明生物购买了METLIN网站的商业版数据库用于LC-MS/MS非靶代谢组学的代谢物鉴定研究(下图为METLIN数据库官网首页图片)。

Vol.3/  KEGG数据库

信号通路是基础科研的精粹所在,而掌握通路浩瀚数据的钥匙就是KEGG。KEGG是日本京都Kanehisa Laboratories根据文献证据手工整理的一个庞大数据库(包括信号通路、基因、疾病、药物等等)。

KEGG有别于其他数据库的一个显著特点就是具有强大的图形功能,它利用直观图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,简单明了。但初见KEGG也不是这么好用的,因为日本人清奇的脑回路,很(sang)贴(xin)心(bin)的(kuang)在网站里放了16个子数据库。

鹿明生物特色代谢产品:

常规蛋白代谢组学产品:


  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018
  • 客服电话: 400-6699-117 转 1000
  • 京ICP备07018254号
  • 电信与信息服务业务经营许可证:京ICP证110310号
  • 京公网安备1101085018

Copyright ©2007-2024 ANTPEDIA, All Rights Reserved