作者hardcover (我要去流浪)
看板RegExp
標題[問題] 算蛋白質長度
時間Tue Aug 26 08:48:26 2008
我有一個檔案像這樣
>sp|P15711|104K_THEPA 104 kDa microneme/rhoptry antigen OS=Theileria parva GN=TP04_0437 PE=2 SV=100
MKFLILLFNILCLFPVLAADNHGVGPQGASGVDPITFDINSNQTGPAFLTAVEMAGVKYL
QVQHGSNVNIHRLVEGNVVIWENASTPLYTGAIVTNNDGPYMAYVEVLGDPNLQFFIKSG
DAWVTLSEHEYLAKLQEIRQAVHIESVFSLNMAFQLENNKYEVETHAKNGANMVTFIPRN
GHICKMVYHKNVRIYKATGNDTVTSVVGFFRGLRLLLINVFSIDDNGMMSNRYFQHVDDK
>sp...
DAWVTLSEHEYLAKLQEIRQAVHIESVFSLNMAFQLENNKYEVETHAKNGANMVTFIPRN
...
>sp...
GHICKMVYHKNVRIYKATGNDTVTSVVGFFRGLRLLLINVFSIDDNGMMSNRYFQHVDDK
...
>sp...
FL...
...
每個蛋白質都由 >sp 隔開,我想算中間那段有多少char,
不知怎麼下 expression ?
thanks
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.114.71.98
1F:推 PsMonkey:RE 沒辦法算長度吧? 08/26 09:29
2F:→ hardcover:喔喔,本來是想說看能不能用一些 linux 上的ultilities 08/27 10:48
3F:→ hardcover:就把答案湊出來。後來還是要寫 program 08/27 10:49