作者expiate (夜露死苦)
看板Statistics
標題[問題] 卡方檢定的資料處理
時間Mon Oct 12 20:25:04 2015
我目前在使用Apache的common math3的套件來作卡方檢定的程式實作。
我要檢定的是一群二維的點是否符合某bivariate normal distribution。
由於這個套件並沒有提共api算某個範圍的機率,
所以我把就每個點當作一個分類的格子,其對應的期望機率就用pdf來查。
也就是o = 1, e = pdf所給的機率值*1
此外,二維的點都是浮點表示,所以我假設不會有重複。
這樣做的卡方檢定是OK的嗎?
謝謝了。
--
與怪物戰鬥的人,應當小心自己不要成為怪物。
當你遠遠凝視深淵時,深淵也在凝視你。
弗里德里希·威廉·尼采
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.23.156
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1444652710.A.490.html
1F:→ andrew43: 卡方的o和e都是次數, 不是機率。 10/12 22:01
2F:→ andrew43: 次數的觀測值和次數在H0下的期望值,說明確一點的話。 10/12 22:04
3F:→ andrew43: 所以你是把一個點都當「1次」這樣算下去嗎? 10/12 22:05
4F:→ andrew43: 在單變量常態的例子中也是要分個幾群來做。 10/12 22:07
5F:→ andrew43: 次數太少就不適卡方分配了,何況你都只有1次。 10/12 22:08
6F:→ expiate: 我是把e的次數用機率乘上一來代表次數。 10/12 22:12
7F:→ expiate: 我的確是把每次點都當一次來看待。看來還是得老老實實 10/12 22:13
8F:→ expiate: 分類。更正,我是把機率乘上總共的觀測點數 10/12 22:14
9F:→ expiate: 謝謝你的提點,感謝感謝 10/12 22:15
10F:→ yhliu: (1) 卡方檢定是大樣本近似, 每個 cell 的期望次數不能太小. 10/13 18:53
11F:→ yhliu: 你的設定完全違背這個要求. 10/13 18:53
12F:→ yhliu: (2) 連續型分布要用卡方檢定, 必然要分組. 因為, 單點的理 10/13 18:55
13F:→ yhliu: 論機率都是 0. 雙變量分布則不只單點機率是 0, 任一簡 10/13 18:56
14F:→ yhliu: 單曲線機率也是 0. 因此定要雙向分組才可能做卡方檢定. 10/13 18:57
15F:→ yhliu: (3) p.d.f. 不是機率. 當然可以利用 p.d.f. 去計算近似機率 10/13 18:58
16F:→ yhliu: 但絕不是直接拿 p.d.f. 當機率用. 10/13 18:59
17F:→ expiate: 再次感謝上面大德的指導。謝謝! 10/14 15:14