作者hajimels (阿一)
看板BioMedInfo
标题Re: [问题] 晶片分析的小问题
时间Thu Dec 17 02:15:07 2009
※ 引述《gsuper (绿色苏打心)》之铭言:
: 我的是 affy 的晶片 50片
: 是同一个实验室出来的
我指的batch不是这个 而是实验设计的问题
像是不同时间点收RNA 就已经有可能有batch effect了
50组实验 array的scanner没有能在一次scan完
如果你分不同时间去scan 你的时间也会有batch effect
affy的片子都会有纪录scan的时间 你可以看一下
:
: 做完 Quality Assessment 後
: 剩下 44片
:
: 然後我跑了 RMA GCRMA dCHIP MAS5
: 暂时不评估 preprocessing 的好坏
: 打算最後用四组资料的交集作为结果
: 然後再评估
恩... 我不太了解为什麽同时要做这麽多normalization後 再来看交集耶?@@
一般来说 我习惯就是RMA normaliztion 再配合MAS5得到Detection call来做QC
画PCA来看一下sample的分布
或是用hierarchical clustering来看看是否能区分出不同群
在看群的时候 我又会检查是我想要看的factor明显
还是像是batch这种我不想看的明显 来决定之後分析的策略
:
: 所以在分析 Inference 时想到这个问题
:
: 因为 preprocessing 实际上的算法有点看不懂
: 所以不知道到底是怎麽调整的
:
: 我想 BGcorrect 和 summation 应该不影响
:
: 但 Normalization 满有可能会出问题
: 毕竟这个步骤是把 44 片调的更相似
: 但 Normal V.S. tumor 本来就会有不相似的地方
: 所以才很疑惑...
affy帮你做array时 会调一个scale factor让你的intesity相近
你可以把normaliztion完後的值 画一个box blot
你会看到 虽然median是相近的 但你的range分布会有差
个人经验 你试试吧
--
★ミ ζ
○_.
/(╯
【今晚的天空有一颗流星划过 在预言着什麽】|>
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 114.37.25.194
1F:推 gsuper:做4种是因为机房的电脑很好 , 10分钟左右就做的完 12/22 19:11
2F:→ gsuper:我想与其花时间了解 preprocessing , 不如让四种方法来投 12/22 19:12
3F:→ gsuper:票 12/22 19:12
4F:→ hajimels:....不是process出来是你想看的就好了... 12/24 01:14
5F:→ hajimels:每个步骤应该都要看这个方法的假设合不合你的rationale 12/24 01:15
6F:推 gsuper:我是相信 nature 2005 年的 review ,说GCRMA和RMA为最佳解 12/24 20:29
7F:→ gsuper:加上这两种方法算出来的重叠性很高 , 目前是用 GCRMA 为主 12/24 20:30