作者Zing119 (Mr.ㄡ)
看板BioMedInfo
标题[工具] 如何知道 BLAST output 所属的species
时间Thu Jun 7 02:41:10 2012
请问BLAST的小问题
我现在想要知道我用blast之後 (against nr database)
所output出来的每条sequence 各是属於哪个species
我知道如果用default的output format
他会秀出 >gb|AAT93342.1| YPR002C-A [Saccharomyces cerevisiae]
里面就会包含species的资讯
但是如果我想要用-m 8这种 tabular 的output format
就只会得到
sp|Q06127|YL334_YEAST gi|74644934|sp|Q06127.1|YL334_YEAST 100.00 126 0 0 1 126 1 126 8e-48 193
sp|Q06127|YL334_YEAST gi|74644557|sp|Q96VH1.1|YC018_YEAST 73.44 64 15 1 14 75 21 84 2e-06 55.8
sp|Q06127|YL334_YEAST gi|158564315|sp|Q6B0V7.2|YPR02_YEAST 68.75 64 18 1 14 75 2 65 2e-04 49.7
sp|Q06127|YL334_YEAST gi|51014097|gb|AAT93342.1| 70.31 64 17 1 14 75 2 65 2e-04 49.7
第二栏这样的id
虽然有些可以从id直接看出species
但仍有许多无法直接辨识
我想请问是否有人知道如何让blast output出简洁的资料 但又要包含species的资讯
又或者
gi|74644934
这个GenBank Identifier该要如何转换呢?
是否有tool或是对应表?
感谢!!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.109.22.146
※ 编辑: Zing119 来自: 140.109.22.146 (06/07 03:03)
1F:→ windincloud:我用很笨的方法是自己先paser subject的fasta 抓对应 06/07 14:33
2F:→ Zing119:但我是比对NR database 并不是自己的database.. 06/07 14:43
3F:→ windincloud:昨天我有帮你看过~ 不管新旧BLAST都没这功能 tool我记 06/08 10:14
4F:→ windincloud:得好像有 要找看看...... 06/08 10:15
5F:推 daniel0523:还是用python,perl写parser把default format里的资料 06/11 01:18
6F:→ daniel0523:一个个抓出来呢?,比对gid找species应该也是要写parser 06/11 01:20
7F:→ daniel0523:把需要的资料捞出来,感觉怎麽作还是得写parser.. 06/11 01:21
8F:推 uper:用bioperl parse你要的资料 会很有效率的 06/12 18:42
9F:→ phycomp:-outfmt '6 sseqid'看是否可以带出来 10/04 07:46