作者LiamIssac (Madchester是这群人压根)
看板Statistics
标题[问题] 跑KS检定但有放松门槛值
时间Sat Jun 23 13:39:37 2018
如果是跟统计软体有关请重发文章,使用程式做为分类。
统计软体,如SPSS, AMOS, SAS, R, STATA, Eviews,请都使用程式做为分类
请详述问题内容,以利板友帮忙解答,过短文章依板规处置,请注意。
为避免版面混乱,请勿手动置底问题,善用E做档案编辑
最近需要用到Kolmogorov-Smirnov检定处理一个问题
(这个问题的文献都是用chi-square 但KS似乎比较好 至少原作Massey Jr.有提过)
而KS检定 主要是根据 empirical分布跟原分布最大的差异绝对值 来做test statistic
d = max |Fn(x) - F(x)|
并比较是否大於某个门槛值 d_c = a/sqrt(N),其中N是sample size 然後a是某个常数
我处理的这个问题 主要的特点就是N会很大 可能几十万甚至更多
所以d_c会变得很小 造成就算Fn跟F很接近 但是检定很常不会过
因此我们想说 让这个门槛值稍微放松
d_c = a/sqrt(N) + \delta
(我是觉得怪怪的 有点为了用而用)
但是如果要这样做 那我应该要证明什麽 才能比较严谨?
比方说 asymptotic distribution不变? 或是 power不变之类的?
不知道有没有前辈可以提点? 谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 163.18.24.79
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1529732379.A.AEF.html
1F:推 andrew43: power很大应该试图解释原因而不是想这些东西06/23 19:33
2F:推 andrew43: 亦或你可以试图以合适的方法检验h0:theta <= 某个值 06/23 19:44
3F:→ LiamIssac: 好 感谢回答 我试着想想看06/23 20:39
4F:推 sifmelcara: 你是想要证明两个分布相等?那样的话要先定义差多少以06/25 18:42
5F:→ sifmelcara: 内算是相等,才有办法做吧?06/25 18:42
您是指Fn跟F吗? 那就是检查d 是否 大於 d_c 这是标准的KS test 但由於我的问题本质
(N非常大) d_c会非常的小 所以就算Fn跟F很接近 但是检定不会过
6F:→ andrew43: 这就是我说theta <= value的意思。谢谢补充。06/25 18:54
这边的theta是我的delta吗?
※ 编辑: LiamIssac (114.27.50.122), 06/26/2018 22:46:49
7F:→ andrew43: 应该不是,而是你关心的参数。 06/27 01:27
8F:→ andrew43: 因为我不知道你实际在做什麽,也没办法说更多。 06/27 01:27
9F:推 krsoon: N很大的情况下,各种检定几乎就是会造成不相等的 06/30 01:12