[問題] 卡方獨立性檢定細格有0

時間Tue Aug 30 15:31:07 2011

拜託不要看到標題就先推Yate's Correction for Continuity或 Fisher's exact probability test 說來慚愧接觸統計將近8年… 最近才聽說卡方檢定中細格不能有零這件事Orz 上網google 「卡方 0」也只有看到一筆資料有提到而且只剩庫存頁面… 資料有幾個變項有很多的變數雖然樣本有超過2000 但是因為資料的特性往往有一個變項很大但是其他細格都是0 例如甲乙丙丁戊己庚 A 280 1 10 0 0 0 2 B 12 5 0 380 5 3 1 C 0 181 3 1 0 2 5 D 1 3 0 21 89 40 20 E 9 20 18 50 150 0 0 類似這樣的狀況如果併項到沒有0 1.會讓特徵消失 2.變項太少失去解釋意義 3.Cramers’V變小請問有什麼方法解決嗎？謝謝 --

※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 163.29.135.126

1^F：推 gsuper:我也想問這問題我的資料是上千筆 3*2 table , 一旦部分資 08/31 02:00

2^F：→ gsuper:料併項整體的算法就不統一..很苦惱 08/31 02:01

3^F：→ bmka:那為什麼不用Fisher's exact test? 08/31 09:44

4^F：→ bmka:你知道為什麼要避免small cells嗎? 08/31 09:46

5^F：→ Kinght:Fisher's是"期望值"小於5 因為會讓檢定值變高 08/31 12:30

6^F：推 laba1014:請問有甚麼ref.提到細格"觀察值"不能為0的限制? 08/31 14:20

7^F：→ laba1014:大部分書提到的只有對"期望值"的限制不是嗎 08/31 14:21

8^F：→ bmka:Kinght大你記錯了,那不是Fisher exact的限制 08/31 19:13

9^F：→ bmka:主要原因也不是檢定值(mistaken for power?) 的問題 08/31 19:14

10^F：→ bmka:引一段 R. A. Fisher在書裡講的話 08/31 19:22

11^F：→ bmka:"The treatment of frequencies by means of chi-square is 08/31 19:23

12^F：→ bmka:an approximation, which is useful for the comparative 08/31 19:23

13^F：→ bmka:simplicity of the calculations. The exact treatment is 08/31 19:23

14^F：→ bmka:somewhat more laborious, though necessary in cases of 08/31 19:24

15^F：→ bmka:doubt.” -- Statistical Methods for Research Workers 08/31 19:24

16^F：→ bmka:他這裡指的statement of doubt就是"期望值"小於五 08/31 19:26

17^F：→ bmka:這種情況下chi-square test statistic"很可能"不是卡方分佈 08/31 19:27

18^F：→ bmka:(修正,"很可能"長得不像卡方分佈, chi-sq test 只是 08/31 19:29

19^F：→ bmka:approximation test) 08/31 19:29

20^F：→ bmka:所以,不好意思,還是請你用Fisher exact test吧 08/31 19:42

21^F：→ yhliu:5×7 table, 要做 exact test? 不知多少時間能算出來? 08/31 21:20

22^F：→ yhliu:卡方檢定是近似檢定方法, 是基於多變量中央極限定理而來的. 08/31 21:20

23^F：→ yhliu:因此, 有 "cell 期望次數至少為 5" 的要求. 但有兩個方向的 08/31 21:21

24^F：→ yhliu:數值研究結論: 一是說對於大型的表, 只要期望值小於5的 cell 08/31 21:22

25^F：→ yhliu:數比例不太高, 而所有 cell 期望值都在 1 以上, 馬馬虎虎啦! 08/31 21:23

26^F：→ yhliu:另一結論說: 即使各細格期望值都在5以上, 但若各細格期望值 08/31 21:24

27^F：→ yhliu:相差太懸殊, 卡方近似還是有疑問的. 08/31 21:25

28^F：→ yhliu:至於 cell observations 是 0 的問題, 很久很久以前看過一篇 08/31 21:26

29^F：→ yhliu:文章, 大意上是說 cell observation 為 0, 則 "殘差" 只能是 08/31 21:27

30^F：→ yhliu:負的, 不能是正的. 好像因此作者建議調整自由度吧?....不過, 08/31 21:28

31^F：→ yhliu:事隔太久記憶不一定真實, 也就是作者是否以調整自由度的方法 08/31 21:29

32^F：→ yhliu:對付, 我無法肯定. 原文出處也沒有印象了. 08/31 21:30

33^F：→ bmka:y大第一點指的是這篇 Koehler and Larntz (1980). An 08/31 21:48

34^F：→ bmka:An empirical investigation of goodness-of-fit statistics 08/31 21:49

35^F：→ bmka:for sparse multinomials. JASA, 75, 336-344. 08/31 21:49

36^F：→ bmka:至於5X7的fisher exact 對現在的電腦來說算是小case啦 08/31 21:50

37^F：→ bmka:如果是更大的table,R的function裡面還有用simulation來 08/31 21:53

38^F：→ bmka:得到p-value這個選項(真的想省時間的話) 08/31 21:53

39^F：推 gsuper:推一個 09/01 02:54

40^F：→ Kinght:所以bmka大認為"即使細格有0 只要期望值<5的格數少於20％ 09/01 08:48

41^F：→ Kinght:仍不用做Fisher exact test"? 09/01 08:49

42^F：→ bmka:我的中文有那麼差嗎....請多愛用Fisher's exact test. 09/01 11:11

43^F：→ Kinght:所以你只是來推廣Fisher exact test？ 09/01 15:41

44^F：→ ADORIAN:b 大是說放心使用 Fisher's exact test 09/01 19:38

45^F：→ bmka:謝謝A大翻譯 :) 09/01 19:57

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

Statistics 板

[問題] 卡方獨立性檢定細格有0

熱門看板

贊助商連結