作者gsuper (统计的巴比伦塔)
看板BioMedInfo
标题[问题] ANOVA table 是否能降维?
时间Tue Mar 9 16:34:21 2010
two-way ANOVA table
-----------------------------------------------------
控制组 控制组 控制组 实验组 实验组 实验组
row1 15 15 15 400 400 400
row2 50 50 50 300 300 300
row3 10 10 10 200 200 200
-----------------------------------------------------
在
交互作用不显着 时
能否进行以下的降维动作?
三条 rows 取平均 , 变成 rowPOOL
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
控制组 控制组 控制组 实验组 实验组 实验组
rowPOOL 25 25 25 300 300 300
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
或是只有交互作用不显着的条件仍然不够
需要其它条件
还是跟本不能这样做?
诚心请教
--
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.113.239.247
※ 编辑: gsuper 来自: 140.113.239.247 (03/08 23:32)
※ 编辑: gsuper 来自: 140.113.239.247 (03/08 23:32)
※ 编辑: gsuper 来自: 140.113.239.247 (03/08 23:34)
※ 编辑: gsuper 来自: 140.113.239.247 (03/08 23:35)
※ 编辑: gsuper 来自: 140.113.239.247 (03/08 23:36)
1F:→ bmka:这样做的结果是sample size少了1/3耶.... 03/09 07:01
2F:→ yhliu:Interaction 不显着固可考虑用无交互作用模型, 甚至 two-way 03/09 08:12
3F:→ yhliu:简化成 one-way, 但不宜改用 "平均值" 做分析. 03/09 08:14
4F:→ yhliu:事实上 two-way without replication 本就难考虑interaction 03/09 08:16
5F:→ yhliu:而仅有 one-way group means 也无法做 means 之间差异推论. 03/09 08:17
有点一言难尽....
这个 case 实际上是这样
-----------------------------------------------------
控制组 控制组 控制组 实验组 实验组 实验组
row1 15 15 15 400 400 400
"Inpp5d"
row2 50 50 50 300 300 300
"Inpp5d"
row3 10 10 10 200 200 200
"Inpp5d"
-----------------------------------------------------
右边绿色的是 基因名
上面的 table 可以视为 one gene region
Total 约 20000~30000 gene regions
Naive method :
3条rows 任意一条显着 , 就说此基因显着
(Most people used)
但这样会造成 Data 的浪费
或是找出一堆 outlier rows
甚至是 两条rows 的结果矛顿
(同时支持显着大和显着小!?)
--> 所以 rows 必需适当的整合
若是样本够大
确实只需要组合 one-way ANOVA 和 two-way ANOVA
就可以靠稳健性直接搞定问题
但因为在实务上样本数都很小
(控制实验各5片就要花 10万 NT)
而且 PDF 为左偏
所以我觉的用 ANOVA 做检定会有问题
(Table 内可能只有 16~40 个数字)
有人帮晶片分析设计了小样本专用的无母数统计 (SAM)
套用 Permutation + Ordered statistic 的概念
可以搞定小样本统计
但此统计方法是套用上述的 Naive method
所以我想是否能用 ANOVA 检定交互作用不显着後
直接变成
rowPool
然後就直接套用 SAM 搞定.....
避免 multiple testing 变成鸡尾酒式的统计流程
所以回归原本的问题
整合成 rowPool 是否会有什麽潜在问题
还是我跟本在乱做? 冏
※ 编辑: gsuper 来自: 140.113.239.247 (03/09 16:29)
※ 编辑: gsuper 来自: 140.113.239.247 (03/09 16:32)
--
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.113.239.247
※ 编辑: gsuper 来自: 140.113.239.247 (03/09 16:35)
※ 编辑: gsuper 来自: 140.113.239.247 (03/09 17:10)
6F:推 hajimels:我可以想成在处理multi-probes for one gene的问题嘛? 03/12 21:46
7F:→ gsuper:就是这个问题!! 没错~~ 03/12 22:47
8F:→ huggie:R 的 affy package 不是有 summarization 的方法吗? 03/13 00:16
在 preprocessing 中
有 summarization 方法
比方说
十条 1007_at -> 一条 1007_at
十条 104898_at -> 一条 104898_at
而在做完 annotation 後 , 会发现
1007_at -> "Surf4"
1004898_at -> "Surf4"
不同的 probeSet
却指向相同的 Symbol
称为 sibling probe set , 或 redundent probe set
※ 编辑: gsuper 来自: 140.113.177.165 (03/13 00:51)
10F:→ huggie:不知道实不实用..但至少有些 discussion 03/14 15:35
11F:→ huggie:看来可能也可能要考虑为何affy设计了多个probe set 03/14 15:36
13F:→ gsuper:1st 就是我准备要书报讨论的 paper 03/14 18:26
14F:→ gsuper:不过我觉的他的方法只适用於大样本 03/14 18:26
15F:→ gsuper:後面那篇我会努力看看 3Q 03/14 18:27
16F:推 hajimels:Pubmed id: 20181266 参考看看 03/15 10:30