作者gsuper (綠色蘇打心)
看板BioMedInfo
標題[問題] 晶片分析的小問題
時間Wed Dec 16 19:37:34 2009
請問一下
我手上有 20片 Normal
20片 Tumor
是 paired data
那我做 preprocessing 時
應該分開做 (2次20片) , 還是一起做 (1次40片) ?
--------------------------------------
我是在算 Inference 時想到這個問題
如果一起算
則 pair data 之間的 distance 會被模糊化
但若分開算
則 pair 性質的可靠性會下降
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.239.247
※ 編輯: gsuper 來自: 140.113.239.247 (12/16 19:40)
※ 編輯: gsuper 來自: 140.113.239.247 (12/16 19:42)
※ 編輯: gsuper 來自: 140.113.239.247 (12/16 19:48)
1F:推 tblu:40片要比較就要一起normalize 12/16 20:07
2F:推 hajimels:40片要一起做normalization 12/16 23:08
3F:→ hajimels:不知道你是用哪一家的microarray? 12/16 23:09
4F:→ hajimels:normalization時 一般常用global median或quantile 12/16 23:09
5F:→ hajimels:做normalization前 要先看一下sample的distribution 12/16 23:10
6F:→ hajimels:ps. affy的RMA是quantile的normalization 12/16 23:10
7F:→ hajimels:另外40片很難是同一個batch做出來的 batch要考慮一下 12/16 23:11
我的是 affy 的晶片 50片
是同一個實驗室出來的
做完 Quality Assessment 後
剩下 44片
然後我跑了 RMA GCRMA dCHIP MAS5
暫時不評估 preprocessing 的好壞
打算最後用四組資料的交集作為結果
然後再評估
所以在分析 Inference 時想到這個問題
因為 preprocessing 實際上的算法有點看不懂
所以不知道到底是怎麼調整的
我想 BGcorrect 和 summation 應該不影響
但 Normalization 滿有可能會出問題
畢竟這個步驟是把 44 片調的更相似
但 Normal V.S. tumor 本來就會有不相似的地方
所以才很疑惑...
※ 編輯: gsuper 來自: 140.113.177.165 (12/17 00:51)
※ 編輯: gsuper 來自: 140.113.177.165 (12/17 00:55)