作者LiamIssac (Madchester是這群人壓根)
看板Statistics
標題[問題] 跑KS檢定但有放鬆門檻值
時間Sat Jun 23 13:39:37 2018
如果是跟統計軟體有關請重發文章,使用程式做為分類。
統計軟體,如SPSS, AMOS, SAS, R, STATA, Eviews,請都使用程式做為分類
請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。
為避免版面混亂,請勿手動置底問題,善用E做檔案編輯
最近需要用到Kolmogorov-Smirnov檢定處理一個問題
(這個問題的文獻都是用chi-square 但KS似乎比較好 至少原作Massey Jr.有提過)
而KS檢定 主要是根據 empirical分布跟原分布最大的差異絕對值 來做test statistic
d = max |Fn(x) - F(x)|
並比較是否大於某個門檻值 d_c = a/sqrt(N),其中N是sample size 然後a是某個常數
我處理的這個問題 主要的特點就是N會很大 可能幾十萬甚至更多
所以d_c會變得很小 造成就算Fn跟F很接近 但是檢定很常不會過
因此我們想說 讓這個門檻值稍微放鬆
d_c = a/sqrt(N) + \delta
(我是覺得怪怪的 有點為了用而用)
但是如果要這樣做 那我應該要證明什麼 才能比較嚴謹?
比方說 asymptotic distribution不變? 或是 power不變之類的?
不知道有沒有前輩可以提點? 謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 163.18.24.79
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1529732379.A.AEF.html
1F:推 andrew43: power很大應該試圖解釋原因而不是想這些東西06/23 19:33
2F:推 andrew43: 亦或你可以試圖以合適的方法檢驗h0:theta <= 某個值 06/23 19:44
3F:→ LiamIssac: 好 感謝回答 我試著想想看06/23 20:39
4F:推 sifmelcara: 你是想要證明兩個分佈相等?那樣的話要先定義差多少以06/25 18:42
5F:→ sifmelcara: 內算是相等,才有辦法做吧?06/25 18:42
您是指Fn跟F嗎? 那就是檢查d 是否 大於 d_c 這是標準的KS test 但由於我的問題本質
(N非常大) d_c會非常的小 所以就算Fn跟F很接近 但是檢定不會過
6F:→ andrew43: 這就是我說theta <= value的意思。謝謝補充。06/25 18:54
這邊的theta是我的delta嗎?
※ 編輯: LiamIssac (114.27.50.122), 06/26/2018 22:46:49
7F:→ andrew43: 應該不是,而是你關心的參數。 06/27 01:27
8F:→ andrew43: 因為我不知道你實際在做什麼,也沒辦法說更多。 06/27 01:27
9F:推 krsoon: N很大的情況下,各種檢定幾乎就是會造成不相等的 06/30 01:12