作者myfirstjump (我的第一跳)
看板Statistics
标题[问题] Logistic regression 样本量需求计算
时间Wed Mar 20 12:40:54 2019
如果是跟统计软体有关请重发文章,使用程式做为分类。
统计软体,如SPSS, AMOS, SAS, R, STATA, Eviews,请都使用程式做为分类
请详述问题内容,以利板友帮忙解答,过短文章依板规处置,请注意。
为避免版面混乱,请勿手动置底问题,善用E做档案编辑
各位好,我有Logistic model配适的需求。
现有资料: 35笔
自变数: 3个连续变数 X1, X2, X3
应变数: Y = 1 (实验再现) / Y = 0 (实验没有再现)
由於实验关系,需计算样本最小需求
参考 F. Y. HSIEH (1989)
http://www.statpower.net/Content/312/Handout/Hsieh%281989%29.pdf
需要决定下方4项目 之後查作者给的table
1) significant level
2) power
3) the probability P of an event at the mean value of all the covariates.
4) the odds ratio of disease correponding to an increase of one sd from the
mean value of the specific covariate, given the mean values of the remaining
covariates.
问题:
1) 作者假设自变数为multivariate normal distribution,如果我的资料没办法转换
成normal,是否就不适用? 还是有其他招?
2) 4个项目中的3如何计算? 我想说P用sample proportion代表,不过他特别指出at
the mean value of the covariates. 我要如何估算X1 = X1_bar 的sample proportion?
3) 4个项目中的4如何计算? 道理同上面,要先算p1, p2,才有odds ratio。
谢谢大家!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 59.124.164.132
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1553056865.A.53B.html
更新:
问题2,3我原本的理解应该有误;新的理解是这样的,我们需指定变数在mean值时
预期的event probability;
举个例子,根据实验特性,X1在mean值时,Y=1的机率预期在0.8(P订为0.8);X1上升一个
sd时,Y=1的机率预期落在0.85
此时odds ratio, 0.85/(1-0.85)÷ 0.8/(1-0.8) = 1.417 (也称为effect size)
所以这两个值应该是指定,而不是从观察值计算。
透过指定effect size(通常从相关研究获得合理预期值),我们得到的sample size
可以有能力让模型detect到X1变动1个sd时,对Y的影响。
不知道这边有没有错误,谢谢。
※ 编辑: myfirstjump (59.124.164.132), 03/25/2019 11:06:42
1F:推 Kshawn: 看似有道理 03/25 11:11
2F:→ andrew43: 对。 03/25 11:11