作者coldeye (知其不可奈何而安之若命)
看板Statistics
標題Re: [問題] 如何把frequency=>probability?
時間Wed Sep 18 23:56:47 2019
: ※ 編輯: coldeye (84.13.81.31 英國), 09/18/2019 08:46:24
: → hsnuyi: 首先 你的n是多少? Chi-squared不一定適合 09/18 15:14
: → hsnuyi: 再者 你只能說兩者的distribution不一樣 母體的狀況跟你當 09/18 15:18
: → hsnuyi: 初抽樣的方式有關 我猜你的n可能不會太大就是了 09/18 15:20
: → hsnuyi: 然後 你Chi-squared是如何執行的? 因為你一直在說機率 你 09/18 15:28
: → hsnuyi: 有group嗎? bias跟var的考量為何? 09/18 15:30
: → hsnuyi: 如果n很小 group的考量就會高度影響rej. H0的機率 09/18 15:34
: → andrew43: 我還是不甚清楚。你要不要編一個明確例子並解一下? 09/18 16:12
:
我的問題是理論層次的思考,而非實際操作。
為了讓問題更清楚,我先舉一般比較熟悉的例子。
假設某盒子中白球的比例為0.1,也可稱作抽到白球的機率為0.1,
我們怎麼「知道」它的比例/機率就是0.1?也就是如何知道它的真實參數?
數學上會說,根據大數法則,當觀測次數趨近無窮大時,
相對頻率會收斂至發生的機率,也就是0.1。
雖然我們做不到無窮大,但我們可以觀測很多次,例如抽100次抽到10顆白球,
這時候就可以用統計估計的方式,
像是直接把相對頻率=機率,或是透過最大概似法MLE來估計背後的真實機率。
透過假設檢定的方式就比較難做到這點,
假設H0: 白球機率=0.1,
我們發現觀測到的相對頻率,在H0下,發生的機會不小,
於是,我們只能說,我們無法拒絕白球機率=0.1。
當我們要進行卡方檢定來檢驗獨立性時,
例如,我們想檢定左右腦側化和左右手優勢是否獨立無關?
H0:Pij=Pi.P.j
(e.g.右腦型的比例/機率為P1.,左手優勢的比例/機率為P.1,
右腦型左手優勢的比例/機率就是P11)
研究發現 左手優勢 右手優勢
右腦型 12 6
左腦型 17 65
檢定結果發現X^2=15.13 > X()^2=6.635 給定alpha=0.01,
所以拒絕H0,表示腦側化與左右手優勢有關。
此時我們透過檢定,從資料中的「相對頻率」推論到「機率」。
但是,卡方檢定不一定每次都能這樣做。
例如, (學期末) 喜歡英文課 不喜歡
(學期初)
喜歡 9 28
不喜歡 24 19
H0:學期末,學生沒有變得更喜歡英文 (即[喜歡->不喜歡]>=[不喜歡->喜歡])
檢定發現,H0被拒絕,得到結論為:學期末學生比學期初變得更喜歡英文,
保守可以說,學生喜歡英文的「比例」發生變化,
但我們能說學生喜歡英文的「機率」產生改變嗎?
回到隨機對照試驗,
假設 實驗組(吃藥D) 對照組(不吃藥)
病人數 2416 1195
死亡率 4.2% 6.8%
H0:實驗組死亡率>=對照組死亡率
經過卡方檢定,發現拒絕H0,實驗組死亡率明顯低於對照組死亡率。
所以表示該藥D的的確降低了「此試驗」中死亡的「比例」或「相對頻率」,
甚至我們還會說該藥D降低了「一般人」死亡的「機率」。
左右腦和吃藥的兩個例子,我們都可以說機率,
而喜歡英文的例子中,說機率似乎有點怪,
難道是因為前類例子中是在實驗控制中進行,
而後類例子則只是對某一班級的觀測結果?
還是,在統計檢定中,no probability in , no probability out?
意思是在H0和H1時,就要假定真實參數是個未知的固定「機率」值,
此時我們檢定的結果就是機率。
若我們在H0和H1時,假定真實參數是個「比例」或「相對頻率」的話,
此時我們是在檢定比例/相對頻率。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 84.13.77.141 (英國)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1568822209.A.6CB.html
※ 編輯: coldeye (84.13.77.141 英國), 09/18/2019 23:58:52
※ 編輯: coldeye (84.13.77.141 英國), 09/19/2019 00:02:46