作者gsuper (绿色苏打心)
看板BioMedInfo
标题[问题] SAM 的 permutation 和 So 的计算
时间Tue Jan 5 21:16:37 2010
自问自答好了
算是对板上的贡献
有错请鞭
-------------------------
Q1.
So的计算 (就是那个 shrinkage 的 constant)
paper上说是用 "window slide" 的方式
让 d(i) 的变异系数最小化
我是看到有个说法是
"variance of 90th percentage"
不知道对不对?
-----------------------------------------------------
A1 : 约 85~95th percentage 的 probeset 之变异数
R 的 package "siggenes" 有时候是定 0
然後把变异数太低的 probeset删除
(in my case , 3千 / 5万)
--------------------------------------------------------
2.
permutation
假设是 control 3片 , 实验组 3片
究竟是下列何者?
A. 整个资料矩阵随机取6个数字 (可重覆取用)
B. 整个资料矩阵随机取6个数字 (不可重覆)
C. 在特定的基因向量 i , 随机取6个数字 (可重覆取用) #每个向量i内都有6个
D. 在特定的基因向量 i , 随机取6个数字 (不可重覆) 数字
------------------------------------------------------
A2 : 假设实验控制各4组
sample column 共 8 条
以 columns 为单位做 permutation
理想次数 , C8取4 , 定为 A 次
此处虽然已满足做 permutation 检定的基础
但无法估计 est-FDR
所以
1. permutation 矩阵 , 每条 db(i) column 都 Rank
2. d(i) 本身 Rank
以上两件事合称为 ordered statistic
之後就是 d(i) - de(i) = delta
在满足以上条件後
A 可下修为 B
B 我认为大约要取 0.75*A
原始 paper 用较精细的 balance permutation, 取36次 , 约为70的一半
所以正常的 permutation , 我认为取 0.75A 是比较可行
然而若电脑够好 , 取 B = 10000次 无妨
-------------------------------------------------------------------
3.
还有 B (permutation次数)
SAM 的 paper
在 4片 V.S. 4片 的实验
取 36 次
我猜是 C4取2 * C4取2
所以 6片 V.S. 6片
应该是 C6取3 * C6取3 吗?
--
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.113.239.247
※ 编辑: gsuper 来自: 140.113.239.247 (01/05 21:18)
※ 编辑: gsuper 来自: 140.113.239.247 (01/05 21:18)
※ 编辑: gsuper 来自: 140.113.239.247 (01/05 21:18)
※ 编辑: gsuper 来自: 140.113.239.247 (01/05 21:20)
※ 编辑: gsuper 来自: 140.113.239.247 (01/16 20:05)