作者shirley7483 (Shirley)
看板Statistics
标题[程式] SPSS 非独立样本使用logistic regression
时间Thu Jun 1 17:12:25 2017
[软体程式类别]:SPSS
[程式问题]:
在SPSS使用logistic regression分析非独立样本,
与回归分析中观察样本必须独立的前提假设是否有冲突?
[软体熟悉度]:新手
[问题叙述]:
我的实验设计是每个受测者会被分配到甲/乙其中一种情境,
每个情境中都有四种不同的商品,受测者须对评估这些商品,并选择购买其中之一,
虽然每个受测者拿到的四种商品都不同,但可依商品特性分成A、B、C、D四种,
研究目的:在不同情境下,评估行为(是否查看评论、是否查看商品资讯)和商品特性
(A、B、C、D)对於购买行为的影响会不会不同
查询过後发现,这类discrete choice model的实验,通常会使用multinomial logistic
regression 或 conditional logistic regression来做分析
想要请教各位的是:
logistic regression有一前提假设是【样本之间必须彼此独立】,
而上述实验属於非独立样本(因为买其中之一就不会买其他的商品),
使用SPSS的 multinomial logit 或 conditional logit 会不会有问题呢?
目前尝试使用SPSS分析,但一想到观察样本必须独立的假设,心里就觉得不太踏实...,
实作中也有遇到一些疑问想请教
1. multinomial logit因为DV要是多类别,所以删减资料,只取被购买的那项商品来分析
dataset size = 受测者人数
DV:购买哪种特性的商品(A、B、C、D)
IV:情境(甲、乙)、背景变项(如:年龄、性别、是否熟悉这类商品...等)、
是否看商品评论、是否看商品资讯、交互作用项
使用multinomial logit的疑问是,若要将所有资料纳入(把未被购买的商品加进来)
,资料结构要如何修改呢?
还是其实可以不修改资料结构,直接把所有资料丢进去跑,只是DV改成是否购买?
2. conditional logit,以survival cox regression来实作,
时间变数的部分是将购买的商品设为1,未被购买的设为2
dataset为long format,size = 受者者人数*商品数(4)
DV:是否购买
IV:情境、背景变项、是否查看评论、是否查看商品资讯、商品特性、交互作用项
想请教这边的conditional logit是否需要考虑观察样本必须独立的前提假设呢?
3. 如果要研究商品特性与情境如何影响评估行为,
将DV改成是否查看评论,这样是不是就能将资料视为独立样本,
可直接使用binary logistic regression了呢?
[程式范例]:
dataset (long format)大概长这样
http://imgur.com/5xUikOW
再请各位协助解惑了,感激不尽!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.240.100.128
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1496308348.A.F6E.html
※ 编辑: shirley7483 (111.240.100.128), 06/01/2017 18:21:54
※ 编辑: shirley7483 (111.240.100.128), 06/01/2017 20:17:24
1F:→ andrew43: 不应该会有假重覆问题。一个人一列资料,应变数是类别。 06/01 20:29
感谢andrew43大的回覆!
您说的一人一列资料的意思是,要把其他未被购买的商品放进来吗?
(如:B/C/D商品的特性、是否查看B/C/D商品的评论、是否查看B/C/D商品的资讯)
还是您的意思是只须分析 每人选择购买的商品 的那笔资料就好?(不管另外三个商品)
另外,关於问题3,如果想以 是否查看评论 来当作应变数,会有非独立样本的问题吗?
(可能有人只看A商品的评论,有人看A、C的评论,有人全部都看)
补充:每个人的ABCD商品是完全不同的,只是有类似的特性才归类成四种类别
(受测者1拿到的A商品与受测者2拿到的A商品不同,但都有A特性)
※ 编辑: shirley7483 (111.240.100.128), 06/01/2017 21:08:51
※ 编辑: shirley7483 (111.240.100.128), 06/01/2017 21:14:03
2F:→ andrew43: 抱歉没注意到你想纳入这些当自变数,先当我没说好了。 06/01 21:40
3F:→ andrew43: 我猜应该还是要转成wide table来做,但多项式罗吉斯大概 06/01 22:14
4F:→ andrew43: 还是没办法解决你的问题。 06/01 22:14
5F:→ shirley7483: 意思是非独立样本用於罗吉斯会造成分析问题? 06/01 22:19
6F:→ shirley7483: 若SPSS与罗吉斯有问题,有什麽分析方法可推荐吗>"< 06/01 22:22
7F:→ andrew43: 会的,如你所述。如果只是二选一会容易处理许多。 06/01 22:22
8F:→ andrew43: 抱歉我也不知道…但你已经把诸项分析可能的盲点都说明了 06/01 22:25
9F:→ andrew43: 可能使用机器学习等更复杂的方法但我不懂不敢多嘴。 06/01 22:28
10F:推 yesrex: 为甚麽会有不独立的问题?? 只要每个人之间独立就好了吧 06/02 08:59
不独立的问题来自於希望将四种商品的特徵与行为都纳入为自变数
在long format(如文中附图)中,虽然每人之间独立,但每笔资料(有纪录每人对每项商品
做出的动作)是不独立的
若是改成wide format,遇到的问题:不知DV、IV该如何设计,才能将未被购买的另外三
个商品纳入考量?
之前曾看过在这类choice model中使用mixed logit来分析的文章,SPSS中可能可使用的是
GEE、mixed model,对这两种方法了解较少,不知道上述dataset适不适合使用?
目前理解是,这两种方法都是以连续变数为应变数,但我的资料中,应变数为类别变数
(「是否购买」或「购买A/B/C/D哪种商品」或「是否查看评论」),故可能不适合...
※ 编辑: shirley7483 (118.150.79.175), 06/02/2017 14:24:21
11F:→ andrew43: mixed model和应变数的型态没有关系。 06/02 17:31
12F:→ andrew43: 但就算是mixed model我也想不出来怎麽解决你所有的麻烦 06/02 17:32
13F:推 yesrex: 不能用是否reivew A,是否review B......当作自变数!? 06/02 18:50
14F:→ andrew43: 这就是wide table的资料。 06/02 18:59
15F:→ shirley7483: 请教一下,若使用wide table,应变数为是否购买,而 06/02 20:20
16F:→ shirley7483: 非购买A/B/C/D哪种商品对吗?等於可直接使用binary 06/02 20:22
17F:→ shirley7483: logistic regression? 06/02 20:23
18F:→ andrew43: wide table应变数可为ABCD选一,自变数包括如yesrex所说 06/02 23:00
19F:→ andrew43: 但这样做多项式罗吉斯不能完全解决所有问题,例如 06/02 23:01
20F:→ andrew43: 有二个人都选了A,但一人只review A而另一人review四者 06/02 23:02
21F:推 yesrex: 请问有什麽问题?不就 beta_1 跟 beta_1+...+beta_4 ?? 06/02 23:09
22F:→ andrew43: 至少可能不够表达所有可能的review情况。 06/03 15:02
23F:→ andrew43: 可能可以把所有情况的组合都当自变数,之後挑掉。 06/03 15:03
感谢yesrex、andrew43!
对於转换成wide table之後有点不太懂,想再请教三个问题 >"<
1.不太确定如何转成wide table(对dummy variable没有很理解)
试着转换之後,wide table大概会长这个样子吗?
http://imgur.com/UIMvKUj
2.yesrex大说的是,使用wide table做MNL,应变数放purchase(此人购买ABCD哪种商品),
自变数就直接将剩下的都丢进去?
3.andrew43大说的之後挑掉的意思是,如第2点,做full model分析後,把不显着的挑掉,
然後继续试各种自变数与交互作用的组合吗?
如果是的话,有个疑问:alterA_review、alterB_review...这四个变数推测是一组的,
,然後其中有一个是reference category。若有两个不显着先剔除,那剩下的两个变数
该如何解释呢?
还是这四个变数是一组的,要就一起剔除,不然就一起留下,才能够解释?
以上,感谢大家不厌其烦的协助!!!
※ 编辑: shirley7483 (111.240.96.23), 06/03/2017 23:52:01
24F:→ andrew43: wide table是这样没错 06/04 15:32
25F:→ andrew43: 问题3可以是所有交互作用,或是摊平成所有情况。 06/04 15:34
26F:→ shirley7483: 感谢各位的回覆!让我可以顺利继续分析 m(_ _)m 06/07 01:01