作者supertitler (好难OO)
看板RegExp
标题Re: [问题] 算蛋白质长度
时间Tue Aug 26 14:00:39 2008
先说一下我的假设
你有一个档案像这样
: >sp|P15711|104K_THEPA 104 kDa microneme/rhoptry antigen OS=Theileria parva GN=TP04_0437 PE=2 SV=100
以>来区隔每个蛋白质,而後是蛋白质的metadata(?)
metadata中不会出现\n,最後以换行作结束
如果是这样的话
: 每个蛋白质都由 >sp 隔开,我想算中间那段有多少char,
: 不知怎麽下 expression ?
要算中间那段资料有多少字元,先取出字串,再看长度多少罗
我的作法是(\n[^>]*),如此可以取得中间的那段资料
至於中间的资料有换行的部份可以直接取代成空白就好
然後看你用什麽语言,去得到字串长度
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 220.129.169.253
※ 编辑: supertitler 来自: 220.129.169.253 (08/26 14:56)
1F:→ hardcover:thanks 08/27 10:50
2F:推 MichaelHsin: | wc -c 08/27 16:36