作者marki (marki)
看板Statistics
标题Poisson offset问题
时间Tue Jun 9 11:03:20 2020
应该是近期的最後一题 @@
https://sites.google.com/site/rlearningsite/catagory/poisson
网页的最後倒数第二个部分 5.Poisson回归应用於比例资料
里面有提到如果是要计算比例资料 要设offset
我的问题是为什麽不能直接先算出每一年的cancer占死亡人口的比率
再把这个比率放到应变数跑就好呢?
我试着这样子跑 会有些许的差异 不清楚为什麽?
我的R code如下:
> death=read.csv("/Users/chihchiachen/Downloads/Death.csv")
> Year_re<-c(24,23,22,21,20,19,18,17,16,15,14,13,12,11,10,9,8,7,6,5,4,3,2,1,0)
> death_cb<-cbind(death, cbind(Year_re))
> deathc=death_cb$Cancer/death_cb$Death #deathc就是cancer占死亡人口的比例
> death_cb<-cbind(death_cb, cbind(deathc))
> glm(formula = deathc ~ Year_re, family = poisson(link = log),
data = death_cb)
结果:
(Intercept) Year_re
-1.7488 0.0229
跟网页上的资料
Intercept 的coef是0.022461 Inctercept是-1.742616有些许的差异
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.116.253.37 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1591671802.A.C5D.html
1F:→ andrew43: offset也不单纯是处理比例资料;「暴露量」意思比较接近 06/09 14:11
2F:→ andrew43: 例如事件发生次数的观测时间、面积、人口密度…… 06/09 14:12
3F:推 andrew43: 结果也不能直接互比,意义完全不同。 06/09 14:18
4F:→ marki: 所以是只要是比例资料。理论上我就是要用offset 吗? 06/09 14:27
5F:→ andrew43: 而且poisson reg怎麽可能接受非负整数之外的应变数? 06/09 14:28
6F:→ andrew43: sorry我以为你改做成linear model。你要这麽做的话,可 06/09 14:35
7F:→ andrew43: 采用quasipoisson,若次数很大则结果应该会很接近。 06/09 14:40
8F:推 andrew43: 回到你的问题,offset的作用是调整暴露量使比较次数公 06/09 16:25
9F:→ andrew43: 平。你所谓的 ”比例资料“ 的话可以视潜在事件发生的 06/09 16:25
10F:→ andrew43: 所有对象数量为offset。 06/09 16:25
11F:→ yhliu: 关键是要做 Poisson regression 还是忽略 Poisson 变量特性 06/10 10:25
12F:→ yhliu: 直接用 rate 去 fit model 已经脱离 Poisson model 的假设. 06/10 10:27
13F:推 collin810: Poisson是用count data喔 06/14 22:03