看板Biotech
标 题Re: 请问要去哪抓所有人类蛋白质序列的资料呢?
发信站生生不息 (Sun Apr 16 14:28:05 2006)
转信站ptt!Group.NCTU!grouppost!Group.NCTU!nculs
※ 引述《soom (是个呆逼)》之铭言:
> ※ 引述《ubiquitin (幸福金金幸福)》之铭言:
> > 我想抓所有蛋白质序列来分析
> > 之前有试过以 swiss prot 连结 UniProt
> > http://www.expasy.uniprot.org/database/download.shtml
> > 但是抓下来的fasta 档案似乎是所有生物的
> > 我用手提电脑跑 perl 写的程式
> > 结果记忆体不够....
> > 所以想先抓所有人类的蛋白 fasta 档就好
> > 只要人类蛋白的
> > 叙列名称和氨基酸序列
> > 请问众大大们
> > 要去去哪抓呢?
> 同一个网页,
> 画面的左侧有一个联结可以通向UniProtKB的ftp
> ftp://ftp.expasy.org/databases/uniprot/current_release/knowledgebase/
> 进去以後选taxonomic_divisions资料夹
> 在里面就有uniprot_sprot_human.dat.gz跟uniprot_trembl_human.dat.gz
> 两个档案,可以自行选择需要的档案
> 希望有帮到你..
我看他的 readme 提到
The UniProt Knowledgebase (UniProtKB) is the central access point for
extensively curated protein information, including function, classification
and cross-references.
所以
这个档案应该有包含一些功能
参考资料上的叙述
我想要找只有 fasta 档就好
感谢感谢
--
◤◥ Or
igin:
中央生科˙生生不息 nculs.twbbs.org.tw
◣◢ A
uthor:
ubiquitin 从 leu.ibms.sinica.edu.tw 发表