作者killerjackal (比利养了一只狗叫比利)
看板Perl
标题[请益] 字串部分比对
时间Fri Jan 27 11:39:04 2012
现在手边有两个档案
档案的格式都差不多长一样
>xxxxxxx(title)xxxxxxxxx
stringstringstringstring......
A档案格式如下:
>UniqueRead1_count1
CTCGCCGTCGCAAACCCAAGCTGTCT
>UniqueRead2_count1
CTCGCCTGGCTGTGGTTCTTCTAACA
>UniqueRead3_count1
CTCGCCTGCTAAGCGTTGAGATCATC
B档案如下:
>UniqueRead1_count1
CTCGCCCCCCCAAAAAAAACAAAAACGCCTCATACGAGATTATCAATTAGCTAAGTTGGTAATGTG
>UniqueRead2_count1
CTCGCCGCCAGTAACATTCATTTACGTTTTATCATATATTTGATTTCTTGCTTTTATTCCATTTAT
>UniqueRead3_count1
CTCGCCTCCTATTCTTCCCGCCACTTCTTGCTTGACCAACAACCTCAGCTCTCATCACTCACCTGG
目的是要看A档案出现的内容是否也在B档案中出现过
意思就是说如果A档案的第一笔资料(资料内容)
>UniqueRead1_count1(此为资料名称)
CTCGCCGTCGCAAACCCAAGCTGTCT (此为资料内容)
这资料内容如果有在B档案的任一部分出现的话,就记录一次
(记录过就换下一笔A档案中的资料)
这样应该要怎麽下手比较好?
有请各位高手赐教了
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 70.185.98.109
1F:→ Godkin:看起来像是ngs的资料~ 01/27 13:13
2F:→ imce:用grep试试看罗 01/27 14:40
3F:→ ontario:所以是>UniqueRead1_count1不比...只比CTCGCCCC... ? 01/28 11:11
4F:→ killerjackal:是的 只比资料内容 01/31 12:34