作者coldeye (知其不可奈何而安之若命)
看板Statistics
標題[問題] 這樣對p值的理解,對嗎?
時間Sun May 19 23:02:03 2019
看了一篇文章「我們與「顯著」的距離:P值是判斷研究成敗的過時指標嗎?」
https://www.thenewslens.com/article/117647
裡頭有一段話:
p值是這樣的條件機率:Pr(X>=x0∣H0)=p(x0)
公式裡的H0,代表虛無假設的統計模型(statistical model),
X代表實際資料的隨機變數,x0代表虛無假設統計模型的隨機變數,
一般來說X與x0分別指實際資料的平均值與統計模型估計的期望值。
請問這段話對X和x0的描述正確嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 84.13.92.29
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1558278126.A.627.html
1F:推 yuyuyuai: 呃,吐槽點有點多。x0不是隨機變數而是常數,也不是期 05/20 02:44
2F:→ yuyuyuai: 望值而是X的觀察值。X也不會是什麼實際資料平均值 05/20 02:44
3F:→ yuyuyuai: p值原定義應該是給定H0之下,隨機變數X的比觀察值x0這 05/20 02:44
4F:→ yuyuyuai: 個值還要極端的機率。 05/20 02:44
5F:→ yuyuyuai: 有點意外關鍵評論網會發這種錯誤百出的文章 05/20 02:44
我和你的理解一樣。
我當初也有和作者通過訊息,但作者堅持是我的理解有問題,他的寫法沒錯。
我在想作者是不是把x0當做alpha值?
問題是p value的計算和alpha值一點關係也沒有。
※ 編輯: coldeye (84.13.92.29), 05/20/2019 17:55:33
6F:推 std92050: 這個不是條件機率吧 之前上統計課我還特地問老師 05/22 01:07
7F:→ std92050: 因為H0本身沒有機率 05/22 01:08
8F:→ std92050: 不能當成條件機率看 05/22 01:08
這說法很有趣。
從頻率論者自身來看,通常會寫成P0(X>=x0; H0),而非Pr(X>=x0∣H0),
而前者不是條件機率。
理由是對他們而言,H0不是隨機變數,也不是事件,自然無法conditional on H0,
另外也沒有Pr(H0)這件事。
但是,對貝氏論者來說,H0描述的值卻是隨機變數,
所以p值對貝氏論者來說,被視為條件機率,且Pr(H0)可被給定或估計。
※ 編輯: coldeye (84.13.86.217), 05/22/2019 20:12:02
9F:推 youngsam: 這敘述問題很大 05/22 20:22
同意。不過,我所貼的這篇文章,文中所提到的調查很有意思,
結果是:太多研究人員都搞錯p值了。
報告裡的一項統計值p值是0.04,請問代表什麼意思?
1虛無假設為真的機率是0.04
2根據現在的資料,虛無假設為真的機率是0.04
3根據0.05的顯著水準,虛無假設為有可能為假
4根據虛無假設為真,觀察到另一次結果的統計值比現在的更極端之機率是0.04
5根據0.05的顯著水準,顯示不支持虛無假設的證據很微弱
不少人選3,其實是錯的。
英文原作者說正確答案其實是4,
第5項加上一句前提「有足夠的考驗力時,」也會是正確的。
※ 編輯: coldeye (84.13.86.217), 05/22/2019 21:12:00
10F:→ andrew43: 可以看看這篇: 05/22 22:16
11F:→ andrew43: A Dirty Dozen: Twelve P-Value Misconceptions 05/22 22:16
12F:→ andrew43: 我覺得每個用得到p-value的人都可以看一看 05/22 22:17
謝謝分享
13F:→ yuyuyuai: 不過作者也自證了很多社會科學研究人員包括他自己其實 05/23 12:52
14F:→ yuyuyuai: 並不太了解p值這件事,還蠻有趣的XD 05/23 12:52
我是很肯定他在推廣導正統計觀念的付出,
只是在文字的定義方面,這篇文章真的有些問題。
※ 編輯: coldeye (84.13.86.217), 05/24/2019 05:45:29