作者tomchc (TOMCHC)
站内Statistics
标题[问题] 相关系数与Fisher transformation
时间Thu Jan 2 21:07:59 2014
如果是跟统计软体有关请重发文章
如果跟论文有关也烦请您重发文章
文章类别是为了帮助大家搜寻资料与解答,造成不便之处请见谅
不好意思
小弟我在做研究分析资料的时候遇到了一些问题
想了几个方法都觉得有点怪怪的
现在我有一个二维的资料表
是人(N)--各基因表现量(G)
接着我把人分成两组N1,N2
每一组当中分别去计算相关系数
计算方式是
取出k个g-g'(基因表现量pair)的pair在N1和N2中
分别计算出相关系数
也就是说
每一个相关系数是N1或N2个样本对的相关系数,总共各有k个
然後对这k*2个相关系数做Fisher transformation
ln((1+r)/(1-r))
可以得到两组常态分布
N1~(μ1,δ1), N2~(μ2,δ2)
希望可以比较这两组人当中是不是相关系数的分布有差异
但是问题来了
这个过程当中牵涉到两个参数
一个是N的大小,跟所取相关系数样本有关
一个是k的大小,跟最後比较的样本有关
要怎麽样处理才对呢?
自己想过如下
1.直接做t-test,这样子就无法把N弄进来
2.Fisher transformation告诉我们
做Fisher transformation後他的标准差是1/sqrt(N-3)
不过这里做了k次
原本想针对他的标准差伸缩*sqrt(N-3)
但是这样反而样本多的标准差变大
好像又以点怪怪的
请问到底要怎麽做才有对呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 124.11.139.229
1F:→ yhliu:k 个表现量是相同基因样本的, 因此你所得到的这些样本相关系 01/05 10:51
2F:→ yhliu:数不能假设是独立的. 但又难以估算它们的相关系数, 因此可能 01/05 10:52
3F:→ yhliu:只好每一种表现量分别去做两样本 t 比较. 另外, 或许需要考 01/05 10:53
4F:→ yhliu:虑 "整体误差率" 的问题... 01/05 10:53
5F:→ yhliu:两独立样本相关系数之比较, 在群体是常态, 并且两样本数都 01/05 10:54
6F:→ yhliu:够大的情况下, 用 Fisher 的 z 转换, 统计量是: 01/05 10:54
7F:→ yhliu:z = (z1-z2)/√{1/(n1-3)+1/(n2-3)} 01/05 10:55