作者hajimels (阿一)
看板BioMedInfo
標題Re: [問題] 晶片分析的小問題
時間Thu Dec 17 02:15:07 2009
※ 引述《gsuper (綠色蘇打心)》之銘言:
: 我的是 affy 的晶片 50片
: 是同一個實驗室出來的
我指的batch不是這個 而是實驗設計的問題
像是不同時間點收RNA 就已經有可能有batch effect了
50組實驗 array的scanner沒有能在一次scan完
如果你分不同時間去scan 你的時間也會有batch effect
affy的片子都會有紀錄scan的時間 你可以看一下
:
: 做完 Quality Assessment 後
: 剩下 44片
:
: 然後我跑了 RMA GCRMA dCHIP MAS5
: 暫時不評估 preprocessing 的好壞
: 打算最後用四組資料的交集作為結果
: 然後再評估
恩... 我不太了解為什麼同時要做這麼多normalization後 再來看交集耶?@@
一般來說 我習慣就是RMA normaliztion 再配合MAS5得到Detection call來做QC
畫PCA來看一下sample的分佈
或是用hierarchical clustering來看看是否能區分出不同群
在看群的時候 我又會檢查是我想要看的factor明顯
還是像是batch這種我不想看的明顯 來決定之後分析的策略
:
: 所以在分析 Inference 時想到這個問題
:
: 因為 preprocessing 實際上的算法有點看不懂
: 所以不知道到底是怎麼調整的
:
: 我想 BGcorrect 和 summation 應該不影響
:
: 但 Normalization 滿有可能會出問題
: 畢竟這個步驟是把 44 片調的更相似
: 但 Normal V.S. tumor 本來就會有不相似的地方
: 所以才很疑惑...
affy幫你做array時 會調一個scale factor讓你的intesity相近
你可以把normaliztion完後的值 畫一個box blot
你會看到 雖然median是相近的 但你的range分布會有差
個人經驗 你試試吧
--
★ミ ζ
○_.
/(╯
【今晚的天空有一顆流星劃過 在預言著什麼】|>
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 114.37.25.194
1F:推 gsuper:做4種是因為機房的電腦很好 , 10分鐘左右就做的完 12/22 19:11
2F:→ gsuper:我想與其花時間了解 preprocessing , 不如讓四種方法來投 12/22 19:12
3F:→ gsuper:票 12/22 19:12
4F:→ hajimels:....不是process出來是你想看的就好了... 12/24 01:14
5F:→ hajimels:每個步驟應該都要看這個方法的假設合不合你的rationale 12/24 01:15
6F:推 gsuper:我是相信 nature 2005 年的 review ,說GCRMA和RMA為最佳解 12/24 20:29
7F:→ gsuper:加上這兩種方法算出來的重疊性很高 , 目前是用 GCRMA 為主 12/24 20:30