作者hajimels (阿一)
看板BioMedInfo
标题Re: [问题] Microarray 的 Clustering
时间Sun Jul 18 23:37:02 2010
※ 引述《gsuper (统计的巴比伦塔)》之铭言:
部分恕删...
>我手上第一组 set , 是合作对象做的实验 , 有 10 片 array --> FC_Ratio 1
>另外两组是 GEO 抓来的 , 跟我们类似的实验 --> FC_Ratio 2
FC_Ratio 3
>3 个 Ratio columns 合成一个矩阵
>拿来比较相似度
data-set的size如何? 如果够大的话,会不会用non-parametric ranking test比较好?
>本来我也觉得欧式距离是最佳选择
>但跑 HCL 後看起来还是很乱
>Kmeans 更不合理
如果你要看expression pattern 用gene的log2 value或是intesity会比较好吧??
distance可以用Pearson's dissimiarity来做
>相关距离里面跑最好的是 Kendall`s tao
>但有点太粗糙 (大中小....XD)
>这有点像是用 clustering 代替 Venn diagram 的感觉
不同为什麽一定要放在一起看耶
光是实验设计一样,用的array平台一样
不同lab出来的data我相信batch effect会相当大
不建议放一起比,即使是用ratio来画也一样
>※ 编辑: gsuper 来自: 140.113.239.247 (07/18 20:19)
>※ 编辑: gsuper 来自: 140.113.239.247 (07/18 20:20)
--
★ミ ζ
○_.
/(╯
【今晚的天空有一颗流星划过 在预言着什麽】|>
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 111.250.209.209