Re: [問題] 由兩個DNA 資料庫搜索相同的DNA 序列

時間Wed Jan 21 16:52:28 2015

※ 引述《goodday06 (goodday)》之銘言： : 我有兩個DNA database: : database A 有約18 萬條序列，每條約500nt : database B 有約5 萬條序列，每條約5000nt : 我希望讓這A、B兩個database 互相比對， : 以找出A、B兩個database中，共有相同20nt 的兩筆序列。 : 我先用 "foreach" 將database A 每條序列分開， : 再用 "substr" 每20個nt 搜索 (DNA 的正反股都要搜索) : 再用 "foreach" 將database B 的序列逐一檢查跟 "substr" 相同者 : 結果... 我用小一點的database 測試並且估算， : 這樣用筆電算完，總共要四千天左右 XD : 想請教先進們 : 是否有節省時間的運算方式? : 或是換好一點的電腦會算比較快嗎? : 先謝不吝賜教!! 延續上一個問題我已經依照L 大的意見將substr 製作成@DB_a，要怎麼製作成 "%hash"? 抱歉我是perl新手 ^^" 十分感謝! --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.89.53 ※ 文章網址: https://webptt.com/m.aspx?n=bbs/Perl/M.1421830351.A.8BE.html

1^F：推 LiloHuang: 是把 substr 切割結果放到 %hash 裡，不是弄成 @DB_a 01/21 21:18

2^F：→ LiloHuang: 建議你把完整程式碼跟輸入的資料直接貼到 GitHub Gist 01/21 21:19

3^F：→ LiloHuang: https://gist.github.com/ 方便更多其他板友也能回答 01/21 21:19

4^F：推 LiloHuang: 這邊的概念是把 Perl 原生的 hash 型別來拿當作 set 用 01/21 21:34

5^F：→ LiloHuang: 若存在一個 key 在某個 hash 容器中，key 肯定是唯一的 01/21 21:36

6^F：→ LiloHuang: 舉例像 $hash{"ATCG"} = 1; 這就是字串 ATCG 當鍵值 01/21 21:38

7^F：→ LiloHuang: 對應的資料可任意的指定，上述的例子是一個數字 1 01/21 21:40

8^F：→ LiloHuang: 你在第一層迴圈時，我猜你會將輸入資料用 substr 切割 01/21 21:42

9^F：→ LiloHuang: 因為你在第二層迴圈寫說要跟 substr 的結果做比較 01/21 21:42

10^F：→ LiloHuang: 因此儲存到 %hash 的資料就會是那些 substr 的小片段 01/21 21:43

11^F：→ LiloHuang: 由於 Perl 的 %hash 具備常數時間複雜度 O(1) 的能力 01/21 21:46

12^F：→ LiloHuang: 在新增資料到 %hash 或者比較某個 key 是否在 %hash 01/21 21:46

13^F：→ LiloHuang: 都是 O(1)，進而使用"記憶體空間"來換取"CPU時間" 01/21 21:48

14^F：→ goodday06: 參考L 大的方法目前估計不用2hr 可以得到我要的資訊 01/22 13:05

15^F：→ goodday06: 太感謝了! 01/22 13:05

16^F：推 LiloHuang: 恭喜！不用 2 小時聽起來正常多了 01/22 20:03

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Perl 板

Re: [問題] 由兩個DNA 資料庫搜索相同的DNA 序列

熱門看板

贊助商連結