作者shirley7483 (Shirley)
看板Statistics
標題[程式] SPSS 非獨立樣本使用logistic regression
時間Thu Jun 1 17:12:25 2017
[軟體程式類別]:SPSS
[程式問題]:
在SPSS使用logistic regression分析非獨立樣本,
與迴歸分析中觀察樣本必須獨立的前提假設是否有衝突?
[軟體熟悉度]:新手
[問題敘述]:
我的實驗設計是每個受測者會被分配到甲/乙其中一種情境,
每個情境中都有四種不同的商品,受測者須對評估這些商品,並選擇購買其中之一,
雖然每個受測者拿到的四種商品都不同,但可依商品特性分成A、B、C、D四種,
研究目的:在不同情境下,評估行為(是否查看評論、是否查看商品資訊)和商品特性
(A、B、C、D)對於購買行為的影響會不會不同
查詢過後發現,這類discrete choice model的實驗,通常會使用multinomial logistic
regression 或 conditional logistic regression來做分析
想要請教各位的是:
logistic regression有一前提假設是【樣本之間必須彼此獨立】,
而上述實驗屬於非獨立樣本(因為買其中之一就不會買其他的商品),
使用SPSS的 multinomial logit 或 conditional logit 會不會有問題呢?
目前嘗試使用SPSS分析,但一想到觀察樣本必須獨立的假設,心裡就覺得不太踏實...,
實作中也有遇到一些疑問想請教
1. multinomial logit因為DV要是多類別,所以刪減資料,只取被購買的那項商品來分析
dataset size = 受測者人數
DV:購買哪種特性的商品(A、B、C、D)
IV:情境(甲、乙)、背景變項(如:年齡、性別、是否熟悉這類商品...等)、
是否看商品評論、是否看商品資訊、交互作用項
使用multinomial logit的疑問是,若要將所有資料納入(把未被購買的商品加進來)
,資料結構要如何修改呢?
還是其實可以不修改資料結構,直接把所有資料丟進去跑,只是DV改成是否購買?
2. conditional logit,以survival cox regression來實作,
時間變數的部分是將購買的商品設為1,未被購買的設為2
dataset為long format,size = 受者者人數*商品數(4)
DV:是否購買
IV:情境、背景變項、是否查看評論、是否查看商品資訊、商品特性、交互作用項
想請教這邊的conditional logit是否需要考慮觀察樣本必須獨立的前提假設呢?
3. 如果要研究商品特性與情境如何影響評估行為,
將DV改成是否查看評論,這樣是不是就能將資料視為獨立樣本,
可直接使用binary logistic regression了呢?
[程式範例]:
dataset (long format)大概長這樣
http://imgur.com/5xUikOW
再請各位協助解惑了,感激不盡!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.240.100.128
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1496308348.A.F6E.html
※ 編輯: shirley7483 (111.240.100.128), 06/01/2017 18:21:54
※ 編輯: shirley7483 (111.240.100.128), 06/01/2017 20:17:24
1F:→ andrew43: 不應該會有假重覆問題。一個人一列資料,應變數是類別。 06/01 20:29
感謝andrew43大的回覆!
您說的一人一列資料的意思是,要把其他未被購買的商品放進來嗎?
(如:B/C/D商品的特性、是否查看B/C/D商品的評論、是否查看B/C/D商品的資訊)
還是您的意思是只須分析 每人選擇購買的商品 的那筆資料就好?(不管另外三個商品)
另外,關於問題3,如果想以 是否查看評論 來當作應變數,會有非獨立樣本的問題嗎?
(可能有人只看A商品的評論,有人看A、C的評論,有人全部都看)
補充:每個人的ABCD商品是完全不同的,只是有類似的特性才歸類成四種類別
(受測者1拿到的A商品與受測者2拿到的A商品不同,但都有A特性)
※ 編輯: shirley7483 (111.240.100.128), 06/01/2017 21:08:51
※ 編輯: shirley7483 (111.240.100.128), 06/01/2017 21:14:03
2F:→ andrew43: 抱歉沒注意到你想納入這些當自變數,先當我沒說好了。 06/01 21:40
3F:→ andrew43: 我猜應該還是要轉成wide table來做,但多項式羅吉斯大概 06/01 22:14
4F:→ andrew43: 還是沒辦法解決你的問題。 06/01 22:14
5F:→ shirley7483: 意思是非獨立樣本用於羅吉斯會造成分析問題? 06/01 22:19
6F:→ shirley7483: 若SPSS與羅吉斯有問題,有什麼分析方法可推薦嗎>"< 06/01 22:22
7F:→ andrew43: 會的,如你所述。如果只是二選一會容易處理許多。 06/01 22:22
8F:→ andrew43: 抱歉我也不知道…但你已經把諸項分析可能的盲點都說明了 06/01 22:25
9F:→ andrew43: 可能使用機器學習等更複雜的方法但我不懂不敢多嘴。 06/01 22:28
10F:推 yesrex: 為甚麼會有不獨立的問題?? 只要每個人之間獨立就好了吧 06/02 08:59
不獨立的問題來自於希望將四種商品的特徵與行為都納入為自變數
在long format(如文中附圖)中,雖然每人之間獨立,但每筆資料(有紀錄每人對每項商品
做出的動作)是不獨立的
若是改成wide format,遇到的問題:不知DV、IV該如何設計,才能將未被購買的另外三
個商品納入考量?
之前曾看過在這類choice model中使用mixed logit來分析的文章,SPSS中可能可使用的是
GEE、mixed model,對這兩種方法瞭解較少,不知道上述dataset適不適合使用?
目前理解是,這兩種方法都是以連續變數為應變數,但我的資料中,應變數為類別變數
(「是否購買」或「購買A/B/C/D哪種商品」或「是否查看評論」),故可能不適合...
※ 編輯: shirley7483 (118.150.79.175), 06/02/2017 14:24:21
11F:→ andrew43: mixed model和應變數的型態沒有關係。 06/02 17:31
12F:→ andrew43: 但就算是mixed model我也想不出來怎麼解決你所有的麻煩 06/02 17:32
13F:推 yesrex: 不能用是否reivew A,是否review B......當作自變數!? 06/02 18:50
14F:→ andrew43: 這就是wide table的資料。 06/02 18:59
15F:→ shirley7483: 請教一下,若使用wide table,應變數為是否購買,而 06/02 20:20
16F:→ shirley7483: 非購買A/B/C/D哪種商品對嗎?等於可直接使用binary 06/02 20:22
17F:→ shirley7483: logistic regression? 06/02 20:23
18F:→ andrew43: wide table應變數可為ABCD選一,自變數包括如yesrex所說 06/02 23:00
19F:→ andrew43: 但這樣做多項式羅吉斯不能完全解決所有問題,例如 06/02 23:01
20F:→ andrew43: 有二個人都選了A,但一人只review A而另一人review四者 06/02 23:02
21F:推 yesrex: 請問有什麼問題?不就 beta_1 跟 beta_1+...+beta_4 ?? 06/02 23:09
22F:→ andrew43: 至少可能不夠表達所有可能的review情況。 06/03 15:02
23F:→ andrew43: 可能可以把所有情況的組合都當自變數,之後挑掉。 06/03 15:03
感謝yesrex、andrew43!
對於轉換成wide table之後有點不太懂,想再請教三個問題 >"<
1.不太確定如何轉成wide table(對dummy variable沒有很理解)
試著轉換之後,wide table大概會長這個樣子嗎?
http://imgur.com/UIMvKUj
2.yesrex大說的是,使用wide table做MNL,應變數放purchase(此人購買ABCD哪種商品),
自變數就直接將剩下的都丟進去?
3.andrew43大說的之後挑掉的意思是,如第2點,做full model分析後,把不顯著的挑掉,
然後繼續試各種自變數與交互作用的組合嗎?
如果是的話,有個疑問:alterA_review、alterB_review...這四個變數推測是一組的,
,然後其中有一個是reference category。若有兩個不顯著先剔除,那剩下的兩個變數
該如何解釋呢?
還是這四個變數是一組的,要就一起剔除,不然就一起留下,才能夠解釋?
以上,感謝大家不厭其煩的協助!!!
※ 編輯: shirley7483 (111.240.96.23), 06/03/2017 23:52:01
24F:→ andrew43: wide table是這樣沒錯 06/04 15:32
25F:→ andrew43: 問題3可以是所有交互作用,或是攤平成所有情況。 06/04 15:34
26F:→ shirley7483: 感謝各位的回覆!讓我可以順利繼續分析 m(_ _)m 06/07 01:01