作者hgsfhevil (evil)
看板BioMedInfo
标题Re: [程式] 关於R-cluster的input file 所接受的格式
时间Wed Dec 3 13:35:41 2008
我现在手上有一堆hexamer(6nt)序列,根据以下的步骤做cluster
1)
先用clustalw做Multiple Alignments得到每个序列alignment的结果
ex:
AATCCA ------AATCCA-
ATCCAA -------ATCCAA
AAATCC -----AAATCC--
AATACG ------AATACG-
2)
根据1)的结果,2.1)将每一个hexamer与其他hexamer(包含自己)的mismatch和shift去计算他的dissmilarity distance,做出dissimilarity matrix
ex:
TCCGGA-
-CCAGAT
的dissmilarity distanc是2(1 mismatch+1 shift)
3)
将将每一个dissimilarity matrix去做average linkage hierarchical clustering
抱歉,刚刚才把paper所说的东西串接起来
所以要给R-cluster的输入档案是dissimilarity matrix的数据资料,所以我要把他整理成csv格式?
但是之後的指令要如何下? ~"~不知道大家知道吗?
ps:
我对R很陌生,也不太懂,我先为之前不清楚的问题道歉,请大家耐心的指教
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.138.155.193
1F:推 auymle:clustalw不就有提供guide tree了吗? 为什麽你还要用R再做一 12/03 14:39
2F:→ auymle:次了? 另外 如果你要用R做的话 那你还是要先懂一些R的基本 12/03 14:40
3F:→ auymle:操作 不然你无法把资料喂进去 12/03 14:41
4F:→ hgsfhevil:恩,我跟老师讨论後,他也觉得我可以直接做,谢谢你 12/03 16:39
5F:→ hgsfhevil:不过讲真的,对於R的指令,基本操作我真的不懂 12/03 18:34
6F:推 hajimels:同意1F 12/03 19:27
7F:→ clickhere:把你的matrix放在d 12/11 11:08
8F:→ clickhere:fit <- hclust(d, method="average") 这行会帮你作完 12/11 11:10
9F:→ clickhere:plot(fit) 画图. 12/11 11:10
10F:→ clickhere:d <- read.csv(....) 可以读档 12/11 11:11