作者bxorw (每天保持微笑)
看板Perl
標題[問題] 如何刪除檔案中不需要的字串?
時間Thu Apr 30 04:41:14 2009
我讀檔一個檔案a.txt,內容如下:
NM_
000014 2 A2M 9606 GACCCCCGGGGTTGGG
NM_
000030 189 AGXT 9606 CCUGCCCACUGGC...
....(數行...)
以下資料都是
NM_XXXXXX \t 數字 \t 字母+數字 \t 9606 \t 字母
我想要將紅色區塊都刪除...
但是有顏色標示的除了9606是固定的以外,剩下的藍色、紅色字數都不固定,但間隔都是
利用一個tab間隔,請問有辦法將資料變成:
NM_
000014 9606 GACCCCCGGGGTTGGG...
NM_
000030 9606 CCUGCCCACUGGC...
....(數行...)
有爬版...但還是不瞭解該怎麼使用,感謝您的回答<_ _>
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.146.203.213
1F:→ frank1983:perl -F'\t' -nae 'print join "\t", @F[0,3,4]' a.txt 04/30 05:50
2F:推 appleboy46:awk -F"\t" '{printf $1 "\t" $4 "\t" $5 "\n"}' file 04/30 10:32
3F:推 timmerix:用split應該可以吧.... 05/02 22:51
4F:推 MacPerson:好像生物資訊都用perl來處理字串@@ 05/04 20:51
5F:→ bxorw:因為真的...很方便= =/ 05/05 13:10
6F:推 MacPerson:這個用split 丟進陣列,或是用regular expression。 05/05 16:05
7F:→ MacPerson:建議你先試著用後者,雖然比前者麻煩,但一旦學會.. 05/05 16:05
8F:→ MacPerson:你字串的處理就全部出師了 05/05 16:06
9F:推 appleboy46:我只能推樓上了 XD 05/05 17:31
10F:推 kornelius:是,生物資訊的話你還可以使用 BioPerl 05/09 00:39
11F:→ bxorw:喔喔...這倒是第一次聽到,感謝樓上回覆:) 05/09 19:43