[转载]分子生物学数据库一览

2010-12-01 10:15 · feichen

综合数据库: 最权威的生物信息学网址链接:http://www.bioinformatics.vg 生物信息学网址链接:http://www.bioinformatics.ca/links_directory/ Nucleic Acid Research Dat

[转载]分子生物学数据库大全

综合数据库:

最权威的生物信息学网址链接:https://www.bioinformatics.vg

生物信息学网址链接:https://www.bioinformatics.ca/links_directory/

Nucleic Acid Research Database Issue:https://nar.oupjournals.org/content/vol32/suppl_2/

一、蛋白相关数据库蛋白质结构域预测工具

Esignal:https://motif.stanford.edu/esignal/

信号传导系统蛋白的结构域预测工具,凡是涉及到信号传导系统的蛋白用这个预测效果最佳

SignalP:https://www.cbs.dtu.dk/services/SignalP/

信号肽预测工具,适合定位于非胞质位置的蛋白质

Emotif:https://motif.stanford.edu/emotif-search/

结构域预测工具,由于其用motif电子学习的方法产生结构域模型,故预测效果比Prosite好

Ematrix:https://fold.stanford.edu/ematrix/

是用Matrix的方法创建的结构域数据库,可与emotif互相印证。其速度快,可快速搜索整个基因组

InterPro:https://www.ebi.ac.uk/InterProScan/

EBI提供的服务,用图形的形式表示出搜索的结构域结果

TRRD:https://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/

转录因子结构域预测的最好数据库。但不会用

Protscale:https://cn.expasy.org/cgi-bin/protscale.pl

可分析该序列的各种性状如活动度、亲水性(Kyte&Doolittle)、抗原性(Hopp&Woods)等

通过寻找MOTIF和Domain来分析蛋白质的功能

A. MOTIF是蛋白中较小的保守序列片断,其概念比Domain小

PROSITE:https://cn.expasy.org/tools/scanprosite/

是专门搜索蛋白质Motif的数据库,其中signature seqs是最重要的motif信息

B. Domain:若干motif可形成一个Domain,每个Domain形成一个球形结构,Domain与Domain之间通常像串珠一样相连

Pfam:https://www.sanger.ac.uk

可以搜索某段序列中的Domain,并以图形化表示出来。这个数据库非常重要。用法:在搜索栏中输入蛋白的swissprot的序列号

CDD:https://www.ebi.ac.uk/interpro/

NCBI搜索时在每个蛋白质Link旁都有Blink,Domains两个链接。Domains可以直接看到这个蛋白的确定的结构域。如果要在CDD数据库寻找Domain信息,则可进入Blink链接,再进行CDD搜索,就可以了。看Domain的详细信息可以到:https://www.ebi.ac.uk/interpro/上进行搜索查看

蛋白跨膜序列分析

kyte-Doolittle疏水性分析:每个等于或高于1.8的峰都可能是跨膜结构域

蛋白质结构预测工具

PREDATOR:https://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_preda.html

蛋白质二级结构预测工具

蛋白质糖基化位点的预测

https://bioresearch.ac.uk/browse/mesh/C0017982L1222670.html

这是个综合连接。包括:DictyOGlyc prediction server,NetOGlyc prediction server,YinOYang server,META II PredictProtein server,O-GLYCBASE,GlycoMod tool

蛋白质结构数据库

MMDB:https://www.ncbi.nlm.nih.gov/Structure/MMDB/mmdb.shtml

NCBI的蛋白质结构数据库,要使用Cn3D v4.1软件观看

PDB:https://www.rcsb.org/pdb/

Protein Data Bank, 要使用Swiss PDB viewer软件观看

蛋白质综合数据库

PIR:https://pir.georgetown.edu

Uniprot https://www.pir.uniprot.org

二、核酸相关数据库

三大主要核酸序列数据库:

EMBL:https://www.ebi.ac.uk/embl/

GenBank:https://www.ncbi.nlm.nih.gov/Genbank/

DDBJ:https://www.ddbj.nig.ac.jp

RNA二级结构及非编码区功能预测:

RNA二级结构预测:https://www.genebee.msu.su/services/rna2_reduced.html

速度快,生成图像

最好的RNA二级结构预测软件:mfold

UTR功能区预测:https://bighost.area.ba.cnr.it/BIG/UTRHome/

预测mRNA翻译能力的在线工具:https://wwwmgs.bionet.nsc.ru/programs/acts2/ma_mRNA.htm

其说明书在:https://wwwmgs.bionet.nsc.ru/mgs/papers/kochetov/bioinf/

RegRNA:https://bidlab.life.nctu.edu.tw/RegRNA2/website/

RFAM:https://www.sanger.ac.uk/Software/Rfam/

RNA world:https://www.imb-jena.de/RNA.html

RNA resource Links:https://bidlab.life.nctu.edu.tw/RegRNA2/website/references/

基因转录调控相关数据库

EPD https://www.epd.isb-sib.ch

真核生物启动子,好用

TRRD:Transcription Regulatory Regions Database

可搜索某一基因的调控区及相关转录因子

TRANSFAC:https://www.generegulation.de

可搜索所有转录因子的数据,好用

启动子数据库:https://www.epi.isb-sib.ch

转录因子结合位点 https://www.ejbiotechnology.info/content/vol3/issue3/full/2/bip/

电子延伸相关在线软件

意大利CAP3软件:https://bio.ifom-firc.it/ASSEMBLY/assemble.html

强烈推荐使用,使用时只需将整个Unigene全部序列文件输入就可以了

序列比对在线软件

Multialin:https://prodes.toulouse.inra.fr/multalin/multalin.html

最好的多序列比对在线工具

FASTA:https://www.ebi.ac.uk/fasta/,https://fasta.bioch.virginia.edu

BLAST:https://www.ncbi.nih.gov/BLAST/

Motif的发现与利用Motif发现新的功能基因

MEME:https://meme.sdsc.edu/meme/website/intro.html

可以发现几个序列所共有的motif以及根据已知的motif搜索est数据库以发现新的基因,此软件输出结果不好读懂

BLOCK Maker:https://blocks.fhcrc.org

in which Block maker is Very Good

https://bioinformatics.weizmann.ac.il/blocks/blockmkr/www/make_blocks.html

可通过蛋白多序列比对寻找其中的保守区域,非常好用,易学

IRES及其他UTR功能序列的预测

UTRscan:https://bighost.area.ba.cnr.it/BIG/UTRScan/,https://www.ba.itb.cnr.it/BIG/UTRScan/

需要先注册email

三、表达数据库

EST聚类表达数据资源

Unigene:https://www.ncbi.nlm.nih.gov/unigene/

不用说了,老牌的EST聚类程序,数据库质量很好,但毛病也不少,不过我常用它

TIGR:https://www.tigr.org/tdb/tgi/

按独一无二的剪接体对EST进行聚类,并从中得出独一无二的共有的序列,每个Cluster的EST都有图形排列显示

Allgenes:https://www.allgenes.org

其EST聚类要求比较严格,但每个Cluster都有一个质量极高的mRNA序列,可轻松定位到基因组上

MIPS:https://mips.gsf.de/proj/human/

MIPS的EST聚类数据库。其中有个工具特别好,就是在BLAST服务中有个可以得到与BLAST基因相近EST的组织分布的程序

特殊的表达数据库

前列腺表达数据库:https://www.pedb.org

膀胱癌EST数据库:https://bladder.nhri.org.tw

Microarray和SAGE表达数据库及其分析工具

全身正常组织microarray数据(U133A, U133B):https://www.dev.gmod.org

较全的全身正常组织microarray数据库,推荐,要搜索表达数据需在search中数据探针名称(U133A, U133B),注意必须安装Adobe SVG Viewer,得到的数据需要用photoshop颠倒过来才能观看。

斯坦福大学生物芯片数据库:https://genome-www5.stanford.edu/

最好的生物芯片数据库,不仅数据源丰富,而且数据搜索软件功能齐全,但要学会也需要点时间

CleanEX:https://www.cleanex.isb-sib.ch

用于分析比较来源于不同技术平台的表达数据

EBI array database:https://www.ebi.ac.uk/arrayexpress/

欧洲生物信息学会主办的基因芯片数据库

RAD:https://www.cbil.upenn.edu/RAD/php/

功能与CleanEX近似,推荐使用

Gene Expression Db:https://discover.nci.nih.gov

提供60多个肿瘤细胞系的基因芯片数据

NIAID:https://madb.niaid.nih.gov

ONCOMINE:https://141.214.6.50/oncomine/main/

AWR1Uko AND MY EMAIL非常好的肿瘤microarray数据库

GENEHOPPER:https://genehopper.lumc.nl/db/

利用accession num将microarray数据与Genebank进行连接的软件

NetAffx:https://www.affymetrix.com/analysis/netaffx/index.affx

Microarray Anotation Database:探针注释数据库

四、其它数据库

免疫学相关数据库

MHCI结合表型预测:https://bimas.dcrt.nih.gov/molbio/hla_bind/

已经试过,非常好用

两种常用表位预测数据库

ProPred-I: https://www.imtech.res.in/raghava/propred1/

SYFPEITHI:https://www.uni-tuebingen.de/uni/kxi/

MHCI表型预测与蛋白酶体降解分析

SYFPEITHI的MHCI表型预测工具:https://syfpeithi.bmi-heidelberg.com/Scripts/MHCServer.dll/EpitopePrediction.htm

SEREX数据库:https://www2.licr.org/CancerImmunomeDB/

CT抗原数据库:https://www.cancerimmunity.org/CTdatabase/

Immunology相关工具综合:https://www.cancerimmunity.org

特殊数据库

McGill:https://ww2.mcgill.ca/androgendb/

雄激素受体数据库

肿瘤数据库

染色体突变数据库:https://www.infobiogen.fr/services/chromcancer/

内源性逆转录病毒数据库:https://www.girinst.org

包含100多个内源性逆转录病毒家族,每个家族都给出了共有序列

基因注释数据库

ensemble:https://www.ensembl.org/Homo_sapiens/

综合各种基因注释的平台

OE:https://vortex.cs.wayne.edu/Projects.html

基因功能注释的重要工具,提供每个注释的生物学意义的评分

GENMAPP:

将基因芯片数据综合在各种生物通路上,帮助分析表达数据的生物学意义

GeneCard:https://bioinformatics.weizmann.ac.il/cards/

很全的基因卡片

突变数据库

HGMD突变数据库:https://archive.uwcm.ac.uk/uwcm/mg/hgmd/search.html

包含各种疾病和基因的突变数据

肿瘤基因数据库:https://condor.bcm.tmc.edu/ermb/tgdb/tgdb.html

搜索起来不是很方便

比较基因组学数据库

VISTA:https://www-gsd.lbl.gov/vista/

最重要的比较基因组学在线软件,强烈推荐使用

PCR相关网站

引物数据库:https://pga.mgh.harvard.edu/primerbank/

含180000条mRNA特异引物,非常好用

方便的实验室运算软件

MOLBIOL.RU:https://molbiol.ru/eng/scripts/

可以进行随机核酸序列的产生,PCR条件优化运算等

密码子使用频度数据库:https://www.kazusa.or.jp/codon/

代理列表

清华大学代理列表:https://www.ipcn.org

西郊天空:https://xjtusky.net/www/mod/ie/

GOOGLE镜像:https://google.ipcn.org或https://google.ipchina.org

关键词: