e作者mitkaffee ()
看板Statistics
標題[問題] 關於常態非常態樣本的界定
時間Fri Apr 17 16:59:54 2015
大家好,我現在有來自不同產地的樣品
我的研究是尋找兩種不同類型的測定之間的關聯性
因為我的樣本數不高(<30),進行常態性檢定結果不符合常態
因此我選用spearman進行相關性檢定,也的確看到非常多具有顯著性的結果
然而我發現我的數值之間存在共線性,因為我雖然是以各種方式測定
但仍然不可避免許多可能相似的測定(且我將兩性質直接跑相關性,有許多值本身有顯著)
為了將測定值結果精簡,且為了想要找到是否存在我無法測定但隱含在變數中的因素
因此我選用因素分析而非主成份
事後找到共同變數後我再進行spearman一次,最終也的確找到兩個極具顯著的對應
但因為我發現我的依變數(也就是物性的測定)本身也非常態
因此我似乎根本不該進行回歸測定
我想請教版友我該如何解決此問題,謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.78.232
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1429261207.A.DDF.html
※ 編輯: mitkaffee (140.112.78.232), 04/17/2015 17:02:35
1F:→ coldwind0912: 其實我不完全理解你的問題 也許你該詳細的說明一下 04/17 17:16
2F:→ coldwind0912: 但直觀上 我認為應該不是做因素分析 而是主成份分析 04/17 17:17
3F:→ mitkaffee: 抱歉,我重新編輯一下我的情況和問題 04/17 17:18
※ 編輯: mitkaffee (140.112.78.232), 04/17/2015 17:26:33
4F:→ coldwind0912: 粹取主成份來跑迴歸...主成份≠因素 很多人亂用.... 04/17 17:18
5F:→ coldwind0912: 或許看晚點有沒有生統方面專長的大大能幫忙回答 04/17 17:20
6F:→ mitkaffee: 我重新編輯好了 請問這樣清楚嗎 04/17 17:26
7F:→ mitkaffee: 我是萃取因素後才跑回歸 我沒有用主成份 04/17 17:27
8F:→ andrew43: 一般線性迴歸的常態性前題是指殘差,而非反應變數。 04/17 19:03
9F:→ andrew43: 另外,你或許也可以考慮使用典型相關分析。 04/17 19:22
10F:→ andrew43: 因素分析的話,或許有其它證據指出你提出的因素是洽當的 04/17 19:30
11F:→ andrew43: 會比較有說服力。畢竟因素分析的軸是可以轉的。 04/17 19:31
12F:→ mitkaffee: 喔喔 所以只要檢定殘差符合常態性即可嗎? 04/17 20:10
13F:→ mitkaffee: 另外我有想過用典型分析 但所學有限 那個對我有點難Q 04/17 20:10
14F:→ mitkaffee: 我是研究所做論文才開始接觸多變量分析 以前只有生統 04/17 20:10
15F:→ mitkaffee: 但我想請問做典型的話有什麼前提嗎 我是否也需要做維度 04/17 20:11
16F:→ mitkaffee: 縮減? 04/17 20:11
17F:→ andrew43: 檢驗典型相關係數要注意是否存在多變量常態。 04/17 21:21
18F:→ andrew43: 但樣本量大時可能沒太要緊。 04/17 21:23
19F:→ mitkaffee: 但我的樣本數只有最多24個 這樣依然有辦法嗎? 04/18 00:18
20F:→ andrew43: 根據經驗,這樣的樣本數很難驗證變數之分配。 04/18 01:40
21F:→ andrew43: 無論如何,你還可以試著對變數做轉型,看會不會更像常態 04/18 01:41
22F:→ mitkaffee: 所以你的意思是如果樣本非常態 仍然必須經過轉換後才能 04/18 23:58
23F:→ mitkaffee: 做迴歸分析嗎? 還是能有不用此限制的方法 04/18 23:58
24F:→ andrew43: 迴歸殘差如果偏離常態,可以試著對應變數轉型。 04/19 00:01
25F:→ andrew43: 這件事大多數統計教科書都有。三言兩語說不完。 04/19 00:02
26F:→ andrew43: 如果要避開此限制就要找robust分析。例如permutation之 04/19 00:03
27F:→ andrew43: 類的。怎麼挑選適當方法也要視情況而定。 04/19 00:04
28F:→ yhliu: 其實, 因素分析隱含假設原資料是符合多變量常態的, 典型相 04/19 21:21
29F:→ yhliu: 關其實就是兩組(多個)變量之間隱含之因素之間的相關, 也是 04/19 21:22
30F:→ yhliu: 在多變量常態的思維下的產物. 04/19 21:22
31F:→ yhliu: 主成分, 其實可以看成只是變數的重組. 04/19 21:23
32F:→ yhliu: 如果解釋變項不動, 對反應變項進行主成分或因素分析, 再用 04/19 21:24
33F:→ yhliu: 結果之主成分或因素分數為反應變數進行分析, 其意義是有些 04/19 21:25
34F:→ yhliu: 不同的. 前者是對 "組合變數" 之分析, 後者是對 "內含因素" 04/19 21:25
35F:→ yhliu: 也就是隱藏於所考慮之諸多原反應變數背後之因子進行的分析. 04/19 21:27
36F:→ yhliu: 如果是對解釋變數而非反應變數進行主成分或因素分析, 再以 04/19 21:28
37F:→ yhliu: 結果為解釋變數, 最後主成分解釋變數可還原成原變數, 而用 04/19 21:30
38F:→ yhliu: 原變數來解釋結果; 而因素分數為解釋變數, 是在分析原考慮 04/19 21:31
39F:→ yhliu: 之解釋變數背後之共同因素對反應變數的影響. 04/19 21:31
※ 編輯: mitkaffee (219.68.139.142), 12/09/2015 22:36:12
※ 編輯: mitkaffee (219.68.139.142), 12/09/2015 22:36:45