作者riviera (Nikita~)
看板Statistics
標題Re: [問題]spearman rank cor跑出來1 or 0.99
時間Wed Apr 19 16:35:33 2023
※ 引述《riviera (Nikita~)》之銘言:
因為樣本很小,大概8~9個,跑了spearman correlation, adjusted for
4 other variables ; 結果跑出幾個p < 0.05的結果,
但是rho = -1, 1, or 0.99 ; 請問這是可以report的嗎?
總覺得怪怪的
謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.74.68 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1681779063.A.18A.html
※ 編輯: riviera (36.226.74.68 臺灣), 04/18/2023 08:53:24
1F:→ celestialgod: 或許可以看看Spearman correlation test的power ana 04/18 09:36
2F:→ celestialgod: lysis 04/18 09:36
3F:→ andrew43: 極端的spearman相關係數就表示二變項的大小順序幾乎完全 04/18 16:31
4F:→ andrew43: 遞增或遞減。從精確檢驗來說,只要5對順序為絕對遞增或 04/18 16:33
5F:→ andrew43: 遞減的資料就能達到p<0.05了,而你的情況可能是絕對遞增 04/18 16:34
6F:→ andrew43: 或遞減有8-9對資料,那exact p-value已經到超級小了。 04/18 16:36
7F:→ andrew43: (N=8, rho=1, exact p-value=0.00005) 04/18 16:38
8F:→ andrew43: 總之,雖然樣本很小,但隨機配對出你的結果的機率很小。 04/18 16:40
9F:→ andrew43: 這已經是有統計意義了。不知道有沒有解釋了你說的「怪」 04/18 16:41
10F:→ andrew43: 另外,這種超小的樣本,我建議用exact p-value而不要用 04/18 17:06
11F:→ andrew43: asymptotic p-value。目前看不出來你選哪一個。 04/18 17:07
謝謝兩位版友的回答
1. power analysis 我來查查,不過似乎有人在討論minimun sample size for Pearson
Spearman and Kendall.
May, Justine O., and Stephen W. Looney. "Sample size charts for Spearman and
Kendall coefficients." Journal of biometrics & biostatistics 11.2 (2020): 1-7.
2. 算出來的p value = 0.028, 0.014, 0.002; 我再來看看怎麼算 exact p value
謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.226.75.28 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1681893335.A.632.html
12F:→ yhliu: 才 8-9 個觀測值,還 adjust by 4 variables,當然呈現表面 04/20 08:37
13F:→ yhliu: 層次的高相關值。假設兩變數是獨立的,共同用 4 個變數做線 04/20 08:39
14F:→ yhliu: 性迴歸取殘差,則殘差間當然存在相關,因為其中有共同的那 04/20 08:41
15F:→ yhliu: 些調整變數的成分。而樣本小使得相關係數高。p 值只是表明 04/20 08:42
16F:→ yhliu: 其樣本相關結果是否來源於純機會因素,何況三個結果中也只 04/20 08:44
17F:→ yhliu: 有第三個顯著性高些...但顯著性高也不代表相關度比較強,更 04/20 08:45
18F:→ yhliu: 別說那相關性可能來自共同調整變數的原因。 04/20 08:47
19F:→ yhliu: 建議:先不做調整看簡單相關是否存在;再就擬探討相關的變 04/20 08:53
20F:→ yhliu: 數個別與調整變數間的關係;最後再分析經調整後的關係,除 04/20 08:56
21F:→ yhliu: 非調整變數是離散型而調整方式是分組樣本,否則個人認為調 04/20 08:58
22F:→ yhliu: 整時不必採同一模型。以迴歸調整為例,X 用 Z1 調整,Y 或 04/20 08:59
23F:→ yhliu: 許用 Z2。因為樣本太小,不能用太多調整變數,尤其是 X, Y 04/20 09:01
24F:→ yhliu: 都用相同變數調整時。 04/20 09:02
25F:→ riviera: 謝謝大大!所以你建議y用a變數adjust;x用b變數adjust;再 04/20 21:18
26F:→ riviera: 再算x,y之間的correlation?避免共同使用同樣cov. adjust 04/20 21:19
27F:→ andrew43: 既然有模型,何不建模做回歸?否則這些調整過的關聯性 04/20 22:38
28F:→ andrew43: 可能也是假的 04/20 22:38
29F:→ andrew43: 但如果要先由這麼多個變數做調整,那也應該沒有檢驗可 04/20 22:48
30F:→ andrew43: 做了,樣本數不夠。 04/20 22:48
31F:→ yhliu: 本太小,看簡單相關都嫌小了,又用一堆不知是否確實有重要 04/21 08:02
32F:→ yhliu: 如果樣本很大,X, Y 用幾個不很重要的變數做調整亦無妨;樣 04/21 08:03
33F:→ yhliu: 本太小,看簡單相關都嫌小了,又用一堆不知是否確實有重要 04/21 08:03
34F:→ yhliu: 關聯的變數調整,殘差自由度小了,而且有因調整所引入的共 04/21 08:05
35F:→ yhliu: 同因素,再看殘差相關已失意義。但又怕簡單相關其中有虛假 04/21 08:07
36F:→ yhliu: 關聯存在,因而想用其他變數調整,那就個別找最重要的調整 04/21 08:08
37F:→ yhliu: 變數。若 X, Y 找到的調整變數相同,則在做殘差間相關時要 04/21 08:10
38F:→ yhliu: 同時考慮其相關是否因調整產生的。即使 X, Y 之調整變數不 04/21 08:12
39F:→ yhliu: 同,也要再看兩調整變數之關聯。個人意見是多看各變數間相 04/21 08:14
40F:→ yhliu: 互的關聯,而後產生一個總體的,似乎合理的解釋。 04/21 08:16
41F:→ yhliu: 或者,仍依正式的方法,用相同變數做調整,但只用一個調整 04/21 08:17
42F:→ yhliu: 變數。可以4個變數一一去試,而後做出綜合的解釋。 04/21 08:21
43F:→ yhliu: 以 n=9 來說,如果同時用4個變數調整 X, Y 而後分析 X, Y 04/21 08:22
44F:→ yhliu: 的關聯,不談因調整而產生的共同因素,單論殘差各剩 4個自 04/21 08:24
45F:→ yhliu: 由度,等於只剩4個樣本點,這樣算出來的相關指標焉能不虛高 04/21 08:26
46F:推 andrew43: 同意老師的觀點。小樣本又要背後容許多個參數,沒有空 04/21 18:19
47F:→ andrew43: 間做推論了。 04/21 18:19
48F:→ andrew43: 更別說,小樣本做回歸調整,調整出來的東西不確定性很 04/21 18:23
49F:→ andrew43: 也沒有納入之後的分析,覺得很不可靠。 04/21 18:23
50F:→ riviera: 謝謝大家的討論!我想就bivariate correlation 04/21 20:26