作者hajimels (阿一)
看板BioMedInfo
标题Re: [问题] 晶片分析的小问题
时间Sun Dec 27 14:01:08 2009
※ 引述《gsuper (绿色苏打心)》之铭言:
: 在 affy 的 u133plus2 晶片
: 有 130 万个 probe cells
: 经过 preprocessing
: 剩下 54675 个 probesets
^^^^^^^^^^^^^^^^^^^^^^^^^^恩... 这边我不太清楚你的preprocessing
因为我平常在做的时候...只有import data -> normalization (RMA)就有54675个probe
然後probe QC以MAS5 generate出来的detection call当filter 取A/P+M+A <= 50%
大约剩个 23,XXX左右吧
: 平均每个基因有 2 个 probesets
: 大致看了一下 range 为 1~7 个 probesets per gene
: 如果 probesets 的结果冲突怎麽办?
: 用投票决定好像不是好方法
: 必竟每个 probeset 的份量都很重 ,
: 1:2 为显着 , 2:1 为不显着
: 实在太武断了
probe跟gene之间的关系可以affy官方那边看到
http://www.affymetrix.com/support/help/IVT_glossary/index.affx
另外我记得probe seq也可以查的到 如果有怪怪的 可以回去看一下那个probe是detect哪
: ----------------------------------------
: Q二 :
: 我是用 double filter 做 Inference
: FC > 1.5 , paired t < 0.05*2 / 54675 (不知道为什麽 , 不取FDR就有数百个显着)
: 因为我是 pair data
: 且实验目的只要找显着大的
:
: 请问 paired data 有必要做 SAM 或 Bayesian inference 吗?
: 我想 paired t 的有效性应该很不错
: 用上述两种可能会拿牛刀杀鸡
: 不知道这样想对不对?
一般来说paired data用paired T是比较好的呀
恩...看到这边 不知道你们lab(或老板的意见) 只想要挑几个可以validation的来做?
因为...你FDR设得还蛮严的 像我做比较large-scale的network modeling
数百个significant genes我有点嫌太少耶
: ---------------------------------------
: Q3 :
: 在 R 的 packages "siggenes" 中
: d.stat() 的结果每次都不同 (这是一个t.test的函式 , 可 pair or unpair)
: 我猜是因为加入了 permutation 的概念
: 但结果也差太多了
: 我选了 2600 个 receptors 来分析
: 有时後有 500 个显着
: 有时後有 300 个显着
: 请问有办法解决吗?
: 还是我该跑一万次取平均 P-value???
permutation我的习惯大概做个1,000次啦
可是我一直不是很喜欢permuatation因为这个概念 是符合统计 但真的符合生物嘛?
这我很保留
:
: -------------------------------------
: 不好意思专问些难题.....
--
★ミ ζ
○_.
/(╯
【今晚的天空有一颗流星划过 在预言着什麽】|>
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 118.167.201.87
1F:推 lingon:Quote from George Box: "All models are wrong, but some 12/29 01:37
2F:→ lingon:are useful" 12/29 01:37