作者gsuper (绿色苏打心)
看板BioMedInfo
标题[问题] 晶片分析的小问题
时间Wed Dec 16 19:37:34 2009
请问一下
我手上有 20片 Normal
20片 Tumor
是 paired data
那我做 preprocessing 时
应该分开做 (2次20片) , 还是一起做 (1次40片) ?
--------------------------------------
我是在算 Inference 时想到这个问题
如果一起算
则 pair data 之间的 distance 会被模糊化
但若分开算
则 pair 性质的可靠性会下降
--
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.113.239.247
※ 编辑: gsuper 来自: 140.113.239.247 (12/16 19:40)
※ 编辑: gsuper 来自: 140.113.239.247 (12/16 19:42)
※ 编辑: gsuper 来自: 140.113.239.247 (12/16 19:48)
1F:推 tblu:40片要比较就要一起normalize 12/16 20:07
2F:推 hajimels:40片要一起做normalization 12/16 23:08
3F:→ hajimels:不知道你是用哪一家的microarray? 12/16 23:09
4F:→ hajimels:normalization时 一般常用global median或quantile 12/16 23:09
5F:→ hajimels:做normalization前 要先看一下sample的distribution 12/16 23:10
6F:→ hajimels:ps. affy的RMA是quantile的normalization 12/16 23:10
7F:→ hajimels:另外40片很难是同一个batch做出来的 batch要考虑一下 12/16 23:11
我的是 affy 的晶片 50片
是同一个实验室出来的
做完 Quality Assessment 後
剩下 44片
然後我跑了 RMA GCRMA dCHIP MAS5
暂时不评估 preprocessing 的好坏
打算最後用四组资料的交集作为结果
然後再评估
所以在分析 Inference 时想到这个问题
因为 preprocessing 实际上的算法有点看不懂
所以不知道到底是怎麽调整的
我想 BGcorrect 和 summation 应该不影响
但 Normalization 满有可能会出问题
毕竟这个步骤是把 44 片调的更相似
但 Normal V.S. tumor 本来就会有不相似的地方
所以才很疑惑...
※ 编辑: gsuper 来自: 140.113.177.165 (12/17 00:51)
※ 编辑: gsuper 来自: 140.113.177.165 (12/17 00:55)