作者shirley7483 (Shirley)
看板Statistics
标题[程式] R mlogit的回归模型解读
时间Wed Jun 7 02:42:32 2017
[软体程式类别]: R mlogit package
[程式问题]: 回归模型的解读
[软体熟悉度]: 新手,曾使用过R但没有很熟悉
[问题叙述]:
上篇已有询问SPSS使用logistic regression的问题(实在很感谢各位!)
但因为一些原因,也需要使用R来做做看....
使用的是mlogit这个套件,相关说明文件也有提到可用於discrete choice model的分析
有三大问题想请教各位:
1. mlogit中的公式为 H1~part1 | part2 | part3
想要请教跑出来的模型中,放在part1、part2、part3的变数分别该如何解读呢?
曾看过的说明文件中,自变数大部分都是连续变数,但我的自变数都是类别或区间变数,
所以有点无法理解到底该如何解读才好QAQ
举例:跑出来的模型如图
http://imgur.com/GIfGuMa
以下我试着照我微薄的理解来解读,想请各位帮忙指正
(我对logistic regression在解读上的理解为【当自变项增加一个单位,应变项A相对於
应变项C的机率会增加几倍】,其中应变项C为参照)
* part1中的review解读成:
若有读商品的评论(从0~1增加一个单位表示从不读到有读),则购买该商品(?)的机率增加
这边的应变数不太知道到底是什麽 @"@
理论上来说应该是【购买LowJ、HighJ、LowU、HighU哪一个商品】,但是从资料结构来看
,又很像是【是否购买】......
* part2中的regulatory_focus解读成:
相较於商品HighJ(参照),在情境从0变成1(增加一单位)的情况下,购买HighU(冒号前面的
那个商品名称)的机率增加
* part3中的review解读成:
相较於商品HighJ,若有读商品的评论,则购买HighU的机率降低
备注:
mlogit的dataset采用long format:
http://imgur.com/3ZPNYNT
参考自mlogit的相关文件:Viton, P.A.(2012).Discrete-Choice Logit Models With R.
2. 承上题,最後模型写出来的回归方程式会是三条还是一条呢?
因为看到有三个截距,所以在想是不是会写成三条,但是放在part1中的review又只有
一个,如果写成三条回归方程式的话,不知道该放进哪一条好
3. 发现三个截距都是显着的,之前看论文都没有看过显着的截距 >"<
google看到有人说可以不用管他,但还是想了解一下截距显着或不显着代表什麽意思?
会对整个模型的解读有影响吗?
问题描述得好像有点长,如果有缺任何资料还请各位提醒,我会尽速补上的!
再恳请各位不吝指教了,感谢 m(_ _)m
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.150.79.175
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1496774555.A.15E.html
※ 编辑: shirley7483 (118.150.79.175), 06/07/2017 03:00:38
1F:→ andrew43: 有先仔细看完 mFormula 这个function的说明了吗? 06/07 08:10
2F:→ andrew43: 会有三条是因为有四类outcome 06/07 08:32
3F:→ andrew43: Intercept的解读和二元逻吉斯一样。留着但检验结果不一 06/07 08:34
4F:→ andrew43: 定是你关心的。 06/07 08:34
5F:→ andrew43: 简单就是当所有自变数是0时事件发生的log odd 06/07 08:37
6F:→ andrew43: 好几个问题都是解读有关。要不要先做一份最单纯简单的 06/07 11:07
7F:→ andrew43: 多项式罗吉斯回归范例练习怎麽解读? 06/07 11:07
感谢andrew43对intercept和回归方程式的说明!
仔细再看过mFormula的说明、google多项式罗吉斯回归後,重新修正解读如下,
如果还有错误,再麻烦各位给予一些提示
另外,我发现通常一个变数不会同时放在part1和part3,所以重新上传一个新模型
http://imgur.com/X65kWUc
对上述新模型,放在part1的appname,参考conditional logit後解读为:
相较於appname1,若appname为appname4,购买(任意)商品的log odds降低0.5
放在part2的regulatory_focus,参考一般的multinomial logit,原先的解读应该没错,
可更精准写成:若regulatory_focus从情境0变成情境1,相较於HighJ,选择HighU的
log odds增加0.14
(在这边先假设有显着,只是单纯解读)
目前还没有找到对part3中变数的解读的例子,说明文件中写到coefficients differ
across alternatives,有点像是看自变数对个别的影响,因此解读为:
和没看评论相比,若有看评论(不限定哪个商品的评论),购买HighJ的log odds增加1.6
※ 编辑: shirley7483 (111.240.93.76), 06/07/2017 22:24:37
8F:→ andrew43: 我猜你用不到part3…我有空时会细看你的回应。 06/08 00:24
9F:→ andrew43: appname你放在part1要有一些前题,因为它的系数是共享的 06/08 00:29
10F:→ andrew43: 这可能需要检查一下appname若放在part2的结果是否很不同 06/08 00:30
11F:→ andrew43: 你目前解读我看来正确,看来很接近终点了。 06/08 00:31
12F:→ andrew43: 更正:part3的解释我不确定是否正确,我也没碰过这种例子 06/08 00:37
13F:→ andrew43: 另外不确定是否已解决「都选同商品但review量不同」一事 06/08 00:46
14F:→ andrew43: 可能要细看该package如何权权衡受测者ID内的四种反应。 06/08 00:47
针对review量不同,还没有找到适当的方法,感谢提醒可以往package中找寻线索!
说明文件中提到alternative specific variables可以放在part1或part3
如果放在part1是想了解对整体(所有应变数)的影响力,
放在part3可以了解对个别的影响
(类似part2中变数会interact with estimable alternative-specific dummys的感觉,
只是part2会放的变数为随respondent而变动的变数(如背景变项),而part3可以放会依商品
选项而变动的变数)
依照上述的理解,因为想细分了解影响力,所以可能也会使用到part3
但不确定解读是以下A、B哪一种:
A 和没看评论相比,若有看评论(不限定哪个商品的评论),购买HighJ的log odds增加1.6
B 和没看评论相比,若有看HighJ的评论,购买HighJ的log odds增加
另外也蛮好奇写成方程式的话,原本当作参照组,但放在part3会多跑出来的那个变数到底
该放哪里
如果有对mlogit熟悉的人,再麻烦帮忙了>"<
※ 编辑: shirley7483 (140.114.123.153), 06/08/2017 13:15:43
15F:→ andrew43: 我可能误会appname的意思了。可以理解它在part1的原因。 06/09 02:42
感谢大家帮助!
目前有大致头绪,来结案(?)一下~
找到一篇论文貌似有使用alternative specific variables with alternative specific
coefficients,也就是上文中说的放在part3的变数
这篇论文提供三个选择,变数对应到每个选择皆有一个系数,文中可推论解读B应该正确!
若有兴趣的人可以参考 How important intrinsic and extrinsic product attributes affect purchase decision (Enneking et al., 2007).
※ 编辑: shirley7483 (111.240.104.195), 06/20/2017 15:58:18