作者bxorw (每天保持微笑)
看板Perl
标题[问题] 如何删除档案中不需要的字串?
时间Thu Apr 30 04:41:14 2009
我读档一个档案a.txt,内容如下:
NM_
000014 2 A2M 9606 GACCCCCGGGGTTGGG
NM_
000030 189 AGXT 9606 CCUGCCCACUGGC...
....(数行...)
以下资料都是
NM_XXXXXX \t 数字 \t 字母+数字 \t 9606 \t 字母
我想要将红色区块都删除...
但是有颜色标示的除了9606是固定的以外,剩下的蓝色、红色字数都不固定,但间隔都是
利用一个tab间隔,请问有办法将资料变成:
NM_
000014 9606 GACCCCCGGGGTTGGG...
NM_
000030 9606 CCUGCCCACUGGC...
....(数行...)
有爬版...但还是不了解该怎麽使用,感谢您的回答<_ _>
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 122.146.203.213
1F:→ frank1983:perl -F'\t' -nae 'print join "\t", @F[0,3,4]' a.txt 04/30 05:50
2F:推 appleboy46:awk -F"\t" '{printf $1 "\t" $4 "\t" $5 "\n"}' file 04/30 10:32
3F:推 timmerix:用split应该可以吧.... 05/02 22:51
4F:推 MacPerson:好像生物资讯都用perl来处理字串@@ 05/04 20:51
5F:→ bxorw:因为真的...很方便= =/ 05/05 13:10
6F:推 MacPerson:这个用split 丢进阵列,或是用regular expression。 05/05 16:05
7F:→ MacPerson:建议你先试着用後者,虽然比前者麻烦,但一旦学会.. 05/05 16:05
8F:→ MacPerson:你字串的处理就全部出师了 05/05 16:06
9F:推 appleboy46:我只能推楼上了 XD 05/05 17:31
10F:推 kornelius:是,生物资讯的话你还可以使用 BioPerl 05/09 00:39
11F:→ bxorw:喔喔...这倒是第一次听到,感谢楼上回覆:) 05/09 19:43