作者huggie (huggie)
看板BioMedInfo
標題[轉錄][求救] 有關FASTA format
時間Mon Jun 2 12:38:48 2008
※ [本文轉錄自 Biotech 看板]
作者: TZUKI (漢堡) 看板: Biotech
標題: [求救] 有關FASTA format
時間: Mon Jun 2 12:21:37 2008
有個問題很困擾...
就是如何能不使用一些特殊程式來將不是FASTA format 的序列轉換成FASTA
我想了很久
也只能想出用word來去算字數再來依長度分行
這方法感覺很遜...
請問板上的大大們
有沒有更好的方法?
不然每次我都只能慢慢來>"<
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 134.208.44.23
1F:推 huggie:借轉 BioMedInfo 歡迎任何dry lab 討論唷 06/02 12:38
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.129.160.62
2F:→ huggie:請問來源格式? 06/02 12:40
3F:→ hajimels:我猜應該是像GenBank或EMBL那樣的format吧 我要上seminar 06/02 12:53
4F:→ hajimels:晚點再回好了...不過在下載時 就可以下載fasta格式了 06/02 12:53
5F:推 cot123:如果有來源格式就好辦了 06/02 13:04
6F:推 masamonster:沒有來源格式應該也可以寫~ 不過一次只能一筆 ^^ 06/02 13:41
7F:→ hajimels:我上seminar偷上b中 cot幫人家寫個code算了XD 06/02 13:42
8F:→ cot123:寫支小程式是ok啦.. 只是如果可以瞭解問題詳細細節比較方便 06/02 14:02
9F:推 nightcatman:#!/usr/bin/perl -w 06/03 06:24
10F:→ nightcatman:open(IN,'data.txt'); 06/03 06:25
11F:→ nightcatman:<IN>; 06/03 06:25
12F:→ nightcatman:@a=<IN>; 06/03 06:25
13F:→ nightcatman:$seq=join('',@a); 06/03 06:25
14F:→ nightcatman:$seq=~s/\s//g; 06/03 06:26
15F:→ nightcatman:print length($seq); 06/03 06:26
16F:→ nightcatman:<>; 06/03 06:26
17F:→ nightcatman:以上 06/03 06:26
18F:→ nightcatman:不過這只有算序列長度而已,分行就再加個for印出,不難 06/03 06:29
19F:→ nightcatman:其他像.gb或.embl之類的也差不多,格式有的話隨手可寫 06/03 06:31