作者hgsfhevil (evil)
看板BioMedInfo
標題Re: [程式] 關於R-cluster的input file 所接受的格式
時間Wed Dec 3 13:35:41 2008
我現在手上有一堆hexamer(6nt)序列,根據以下的步驟做cluster
1)
先用clustalw做Multiple Alignments得到每個序列alignment的結果
ex:
AATCCA ------AATCCA-
ATCCAA -------ATCCAA
AAATCC -----AAATCC--
AATACG ------AATACG-
2)
根據1)的結果,2.1)將每一個hexamer與其他hexamer(包含自己)的mismatch和shift去計算他的dissmilarity distance,做出dissimilarity matrix
ex:
TCCGGA-
-CCAGAT
的dissmilarity distanc是2(1 mismatch+1 shift)
3)
將將每一個dissimilarity matrix去做average linkage hierarchical clustering
抱歉,剛剛才把paper所說的東西串接起來
所以要給R-cluster的輸入檔案是dissimilarity matrix的數據資料,所以我要把他整理成csv格式?
但是之後的指令要如何下? ~"~不知道大家知道嗎?
ps:
我對R很陌生,也不太懂,我先為之前不清楚的問題道歉,請大家耐心的指教
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.138.155.193
1F:推 auymle:clustalw不就有提供guide tree了嗎? 為什麼你還要用R再做一 12/03 14:39
2F:→ auymle:次了? 另外 如果你要用R做的話 那你還是要先懂一些R的基本 12/03 14:40
3F:→ auymle:操作 不然你無法把資料餵進去 12/03 14:41
4F:→ hgsfhevil:恩,我跟老師討論後,他也覺得我可以直接做,謝謝你 12/03 16:39
5F:→ hgsfhevil:不過講真的,對於R的指令,基本操作我真的不懂 12/03 18:34
6F:推 hajimels:同意1F 12/03 19:27
7F:→ clickhere:把你的matrix放在d 12/11 11:08
8F:→ clickhere:fit <- hclust(d, method="average") 這行會幫你作完 12/11 11:10
9F:→ clickhere:plot(fit) 畫圖. 12/11 11:10
10F:→ clickhere:d <- read.csv(....) 可以讀檔 12/11 11:11