作者riviera (Nikita~)
看板Statistics
标题Re: [问题]spearman rank cor跑出来1 or 0.99
时间Wed Apr 19 16:35:33 2023
※ 引述《riviera (Nikita~)》之铭言:
因为样本很小,大概8~9个,跑了spearman correlation, adjusted for
4 other variables ; 结果跑出几个p < 0.05的结果,
但是rho = -1, 1, or 0.99 ; 请问这是可以report的吗?
总觉得怪怪的
谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.226.74.68 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1681779063.A.18A.html
※ 编辑: riviera (36.226.74.68 台湾), 04/18/2023 08:53:24
1F:→ celestialgod: 或许可以看看Spearman correlation test的power ana 04/18 09:36
2F:→ celestialgod: lysis 04/18 09:36
3F:→ andrew43: 极端的spearman相关系数就表示二变项的大小顺序几乎完全 04/18 16:31
4F:→ andrew43: 递增或递减。从精确检验来说,只要5对顺序为绝对递增或 04/18 16:33
5F:→ andrew43: 递减的资料就能达到p<0.05了,而你的情况可能是绝对递增 04/18 16:34
6F:→ andrew43: 或递减有8-9对资料,那exact p-value已经到超级小了。 04/18 16:36
7F:→ andrew43: (N=8, rho=1, exact p-value=0.00005) 04/18 16:38
8F:→ andrew43: 总之,虽然样本很小,但随机配对出你的结果的机率很小。 04/18 16:40
9F:→ andrew43: 这已经是有统计意义了。不知道有没有解释了你说的「怪」 04/18 16:41
10F:→ andrew43: 另外,这种超小的样本,我建议用exact p-value而不要用 04/18 17:06
11F:→ andrew43: asymptotic p-value。目前看不出来你选哪一个。 04/18 17:07
谢谢两位版友的回答
1. power analysis 我来查查,不过似乎有人在讨论minimun sample size for Pearson
Spearman and Kendall.
May, Justine O., and Stephen W. Looney. "Sample size charts for Spearman and
Kendall coefficients." Journal of biometrics & biostatistics 11.2 (2020): 1-7.
2. 算出来的p value = 0.028, 0.014, 0.002; 我再来看看怎麽算 exact p value
谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.226.75.28 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1681893335.A.632.html
12F:→ yhliu: 才 8-9 个观测值,还 adjust by 4 variables,当然呈现表面 04/20 08:37
13F:→ yhliu: 层次的高相关值。假设两变数是独立的,共同用 4 个变数做线 04/20 08:39
14F:→ yhliu: 性回归取残差,则残差间当然存在相关,因为其中有共同的那 04/20 08:41
15F:→ yhliu: 些调整变数的成分。而样本小使得相关系数高。p 值只是表明 04/20 08:42
16F:→ yhliu: 其样本相关结果是否来源於纯机会因素,何况三个结果中也只 04/20 08:44
17F:→ yhliu: 有第三个显着性高些...但显着性高也不代表相关度比较强,更 04/20 08:45
18F:→ yhliu: 别说那相关性可能来自共同调整变数的原因。 04/20 08:47
19F:→ yhliu: 建议:先不做调整看简单相关是否存在;再就拟探讨相关的变 04/20 08:53
20F:→ yhliu: 数个别与调整变数间的关系;最後再分析经调整後的关系,除 04/20 08:56
21F:→ yhliu: 非调整变数是离散型而调整方式是分组样本,否则个人认为调 04/20 08:58
22F:→ yhliu: 整时不必采同一模型。以回归调整为例,X 用 Z1 调整,Y 或 04/20 08:59
23F:→ yhliu: 许用 Z2。因为样本太小,不能用太多调整变数,尤其是 X, Y 04/20 09:01
24F:→ yhliu: 都用相同变数调整时。 04/20 09:02
25F:→ riviera: 谢谢大大!所以你建议y用a变数adjust;x用b变数adjust;再 04/20 21:18
26F:→ riviera: 再算x,y之间的correlation?避免共同使用同样cov. adjust 04/20 21:19
27F:→ andrew43: 既然有模型,何不建模做回归?否则这些调整过的关联性 04/20 22:38
28F:→ andrew43: 可能也是假的 04/20 22:38
29F:→ andrew43: 但如果要先由这麽多个变数做调整,那也应该没有检验可 04/20 22:48
30F:→ andrew43: 做了,样本数不够。 04/20 22:48
31F:→ yhliu: 本太小,看简单相关都嫌小了,又用一堆不知是否确实有重要 04/21 08:02
32F:→ yhliu: 如果样本很大,X, Y 用几个不很重要的变数做调整亦无妨;样 04/21 08:03
33F:→ yhliu: 本太小,看简单相关都嫌小了,又用一堆不知是否确实有重要 04/21 08:03
34F:→ yhliu: 关联的变数调整,残差自由度小了,而且有因调整所引入的共 04/21 08:05
35F:→ yhliu: 同因素,再看残差相关已失意义。但又怕简单相关其中有虚假 04/21 08:07
36F:→ yhliu: 关联存在,因而想用其他变数调整,那就个别找最重要的调整 04/21 08:08
37F:→ yhliu: 变数。若 X, Y 找到的调整变数相同,则在做残差间相关时要 04/21 08:10
38F:→ yhliu: 同时考虑其相关是否因调整产生的。即使 X, Y 之调整变数不 04/21 08:12
39F:→ yhliu: 同,也要再看两调整变数之关联。个人意见是多看各变数间相 04/21 08:14
40F:→ yhliu: 互的关联,而後产生一个总体的,似乎合理的解释。 04/21 08:16
41F:→ yhliu: 或者,仍依正式的方法,用相同变数做调整,但只用一个调整 04/21 08:17
42F:→ yhliu: 变数。可以4个变数一一去试,而後做出综合的解释。 04/21 08:21
43F:→ yhliu: 以 n=9 来说,如果同时用4个变数调整 X, Y 而後分析 X, Y 04/21 08:22
44F:→ yhliu: 的关联,不谈因调整而产生的共同因素,单论残差各剩 4个自 04/21 08:24
45F:→ yhliu: 由度,等於只剩4个样本点,这样算出来的相关指标焉能不虚高 04/21 08:26
46F:推 andrew43: 同意老师的观点。小样本又要背後容许多个参数,没有空 04/21 18:19
47F:→ andrew43: 间做推论了。 04/21 18:19
48F:→ andrew43: 更别说,小样本做回归调整,调整出来的东西不确定性很 04/21 18:23
49F:→ andrew43: 也没有纳入之後的分析,觉得很不可靠。 04/21 18:23
50F:→ riviera: 谢谢大家的讨论!我想就bivariate correlation 04/21 20:26