作者coldeye (知其不可奈何而安之若命)
看板Statistics
标题Re: [问题] 如何把frequency=>probability?
时间Wed Sep 18 23:56:47 2019
: ※ 编辑: coldeye (84.13.81.31 英国), 09/18/2019 08:46:24
: → hsnuyi: 首先 你的n是多少? Chi-squared不一定适合 09/18 15:14
: → hsnuyi: 再者 你只能说两者的distribution不一样 母体的状况跟你当 09/18 15:18
: → hsnuyi: 初抽样的方式有关 我猜你的n可能不会太大就是了 09/18 15:20
: → hsnuyi: 然後 你Chi-squared是如何执行的? 因为你一直在说机率 你 09/18 15:28
: → hsnuyi: 有group吗? bias跟var的考量为何? 09/18 15:30
: → hsnuyi: 如果n很小 group的考量就会高度影响rej. H0的机率 09/18 15:34
: → andrew43: 我还是不甚清楚。你要不要编一个明确例子并解一下? 09/18 16:12
:
我的问题是理论层次的思考,而非实际操作。
为了让问题更清楚,我先举一般比较熟悉的例子。
假设某盒子中白球的比例为0.1,也可称作抽到白球的机率为0.1,
我们怎麽「知道」它的比例/机率就是0.1?也就是如何知道它的真实参数?
数学上会说,根据大数法则,当观测次数趋近无穷大时,
相对频率会收敛至发生的机率,也就是0.1。
虽然我们做不到无穷大,但我们可以观测很多次,例如抽100次抽到10颗白球,
这时候就可以用统计估计的方式,
像是直接把相对频率=机率,或是透过最大概似法MLE来估计背後的真实机率。
透过假设检定的方式就比较难做到这点,
假设H0: 白球机率=0.1,
我们发现观测到的相对频率,在H0下,发生的机会不小,
於是,我们只能说,我们无法拒绝白球机率=0.1。
当我们要进行卡方检定来检验独立性时,
例如,我们想检定左右脑侧化和左右手优势是否独立无关?
H0:Pij=Pi.P.j
(e.g.右脑型的比例/机率为P1.,左手优势的比例/机率为P.1,
右脑型左手优势的比例/机率就是P11)
研究发现 左手优势 右手优势
右脑型 12 6
左脑型 17 65
检定结果发现X^2=15.13 > X()^2=6.635 给定alpha=0.01,
所以拒绝H0,表示脑侧化与左右手优势有关。
此时我们透过检定,从资料中的「相对频率」推论到「机率」。
但是,卡方检定不一定每次都能这样做。
例如, (学期末) 喜欢英文课 不喜欢
(学期初)
喜欢 9 28
不喜欢 24 19
H0:学期末,学生没有变得更喜欢英文 (即[喜欢->不喜欢]>=[不喜欢->喜欢])
检定发现,H0被拒绝,得到结论为:学期末学生比学期初变得更喜欢英文,
保守可以说,学生喜欢英文的「比例」发生变化,
但我们能说学生喜欢英文的「机率」产生改变吗?
回到随机对照试验,
假设 实验组(吃药D) 对照组(不吃药)
病人数 2416 1195
死亡率 4.2% 6.8%
H0:实验组死亡率>=对照组死亡率
经过卡方检定,发现拒绝H0,实验组死亡率明显低於对照组死亡率。
所以表示该药D的的确降低了「此试验」中死亡的「比例」或「相对频率」,
甚至我们还会说该药D降低了「一般人」死亡的「机率」。
左右脑和吃药的两个例子,我们都可以说机率,
而喜欢英文的例子中,说机率似乎有点怪,
难道是因为前类例子中是在实验控制中进行,
而後类例子则只是对某一班级的观测结果?
还是,在统计检定中,no probability in , no probability out?
意思是在H0和H1时,就要假定真实参数是个未知的固定「机率」值,
此时我们检定的结果就是机率。
若我们在H0和H1时,假定真实参数是个「比例」或「相对频率」的话,
此时我们是在检定比例/相对频率。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 84.13.77.141 (英国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1568822209.A.6CB.html
※ 编辑: coldeye (84.13.77.141 英国), 09/18/2019 23:58:52
※ 编辑: coldeye (84.13.77.141 英国), 09/19/2019 00:02:46