作者myfirstjump (我的第一跳)
看板Statistics
標題[問題] Logistic regression 樣本量需求計算
時間Wed Mar 20 12:40:54 2019
如果是跟統計軟體有關請重發文章,使用程式做為分類。
統計軟體,如SPSS, AMOS, SAS, R, STATA, Eviews,請都使用程式做為分類
請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。
為避免版面混亂,請勿手動置底問題,善用E做檔案編輯
各位好,我有Logistic model配適的需求。
現有資料: 35筆
自變數: 3個連續變數 X1, X2, X3
應變數: Y = 1 (實驗再現) / Y = 0 (實驗沒有再現)
由於實驗關係,需計算樣本最小需求
參考 F. Y. HSIEH (1989)
http://www.statpower.net/Content/312/Handout/Hsieh%281989%29.pdf
需要決定下方4項目 之後查作者給的table
1) significant level
2) power
3) the probability P of an event at the mean value of all the covariates.
4) the odds ratio of disease correponding to an increase of one sd from the
mean value of the specific covariate, given the mean values of the remaining
covariates.
問題:
1) 作者假設自變數為multivariate normal distribution,如果我的資料沒辦法轉換
成normal,是否就不適用? 還是有其他招?
2) 4個項目中的3如何計算? 我想說P用sample proportion代表,不過他特別指出at
the mean value of the covariates. 我要如何估算X1 = X1_bar 的sample proportion?
3) 4個項目中的4如何計算? 道理同上面,要先算p1, p2,才有odds ratio。
謝謝大家!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.124.164.132
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1553056865.A.53B.html
更新:
問題2,3我原本的理解應該有誤;新的理解是這樣的,我們需指定變數在mean值時
預期的event probability;
舉個例子,根據實驗特性,X1在mean值時,Y=1的機率預期在0.8(P訂為0.8);X1上升一個
sd時,Y=1的機率預期落在0.85
此時odds ratio, 0.85/(1-0.85)÷ 0.8/(1-0.8) = 1.417 (也稱為effect size)
所以這兩個值應該是指定,而不是從觀察值計算。
透過指定effect size(通常從相關研究獲得合理預期值),我們得到的sample size
可以有能力讓模型detect到X1變動1個sd時,對Y的影響。
不知道這邊有沒有錯誤,謝謝。
※ 編輯: myfirstjump (59.124.164.132), 03/25/2019 11:06:42
1F:推 Kshawn: 看似有道理 03/25 11:11
2F:→ andrew43: 對。 03/25 11:11