作者souldragon (依法不依人)
看板ask-why
標題[請益] 班佛定律至少要有3000樣本數是怎麼算的?
時間Tue Nov 9 00:04:09 2021
班佛定律老實說很冷門 我看了1,20本經濟或統計的書也沒啥人引用過
有人說可以用來檢驗選舉或帳目有無人為篡改 條件是隨機資料要有3000筆以上
隨機資料和隨機抽樣意思差不多 就是不能有外部人為干預下自然產生的結果
比如統計樣本至少要有1068才能反應母體 那3000這數字是怎麼得出來的?
若有這限制 也無法用來檢驗選舉作票 因為每投票所的人口不到3000
通常都在2000以下 投票率七成則在1500以下 數據永遠不到3000筆
至少每個投票所母數要有5000 投票率六成以上才能符合門檻值
樣本數量根本未達標 還有人用這理論在檢驗 不是很奇怪??
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.168.239.230 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/ask-why/M.1636387454.A.2DD.html
1F:→ yhliu: 應是檢定力(power of test)的考慮. 欲檢定是否符合班佛定律 06/24 07:48
2F:→ yhliu: 如果有100筆或110筆資料, 也就是 n = 100 以上大概就可以做 06/24 07:50
3F:→ yhliu: 卡方近似檢定了, 甚至更小的樣本也勉強可以. 然而只有檢定 06/24 07:51
4F:→ yhliu: 力夠高, 才可能合理地檢測出不符合該定律的情況. 也就是說, 06/24 07:53
5F:→ yhliu: 必須決定一個不符班佛定律的分布, 然後要求上述卡方檢定拒 06/24 07:55
6F:→ yhliu: 絕 "資料符合班佛定律" 這假說的機率夠高, 例如 0.90 以上. 06/24 07:56
7F:→ yhliu: 經計算, 如果乖離比例(真實比例與班佛定律機率相對離差)平 06/24 10:15
8F:→ yhliu: 方的平均是 0.01, 相當於平均 10% 的乖離率, 則 n=3000 時 06/24 10:17
9F:→ yhliu: 檢定力約 0.99, 如果 n = 2000, 檢定力略高於 0.90, 哦... 06/24 10:18
10F:→ yhliu: 這是在顯著水準定為 0.05 的情況. 06/24 10:20
11F:→ souldragon: 那用統計學就好了 樣本數1068就能達到95%的信心水準 06/30 20:03
12F:→ souldragon: 班佛定律樣本數要2000才達到90% 應該被奧坎剃刀砍掉 06/30 20:04
※ 編輯: souldragon (118.168.234.48 臺灣), 06/30/2022 20:05:24