作者QooHo (Qooo)
看板Statistics
標題[問題] 虛擬變數的設定
時間Fri Apr 22 01:24:34 2016
大家好
想請問關於虛擬變數的設定問題
看到的虛擬變數設置好像都是N個類別設成N-1個變數
譬如說
考量不同飲料銷售量對於營業額的影響
第一類:珍珠奶茶 第二類:椰果奶茶 參考值:奶茶(都不加)
關係就像
d1(加珍珠) d2(加椰果)
珍珠奶茶 1 0
椰果奶茶 0 1
奶茶 0 0
營業額=常數+B1*d1+B2*d2 這樣
那想請問如果加入一品項為鴛鴦奶茶(有加珍珠又有加椰果)
這樣是否能表示為
d1(加珍珠) d2(加椰果)
珍珠奶茶 1 0
椰果奶茶 0 1
奶茶 0 0
鴛鴦奶茶 1 1
關係式同上
還是一定要表示為
d1(加珍珠) d2(加椰果) d3(加珍珠跟椰果)
珍珠奶茶 1 0 0
椰果奶茶 0 1 0
奶茶 0 0 0
鴛鴦奶茶 0 0 1
營業額=常數+B1*d1+B2*d2+B3*d3 呢
另外想請問(1)加珍珠、椰果跟鴛鴦都是各+5元
(2)加珍珠跟椰果是+5元 加鴛鴦=珍珠+椰果各一份=10元
這樣對設定方式會有影響嗎?
非常謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.175.125.61
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1461259477.A.759.html
※ 編輯: QooHo (1.175.125.61), 04/22/2016 01:25:02
1F:→ andrew43: 後者。 04/22 02:19
2F:→ andrew43: 前者會變成二因子設計,但和你的例子牛頭不對馬嘴。 04/22 02:37
3F:→ andrew43: 但如果你變成二因子:有無珍珠與有無椰果,前者就對了。 04/22 02:38
4F:→ andrew43: 不過模型可能要加考慮交互作用項 04/22 02:39
5F:→ andrew43: 此外若不是平衡設計,0-1的虛擬變數有其它問題 04/22 02:42
非常謝謝你
我要的0跟1 應該是指有無椰果沒錯
這樣如果兩者互不影響表示成
營業額=常數+B1*D珍珠+B2*D椰果
(奶茶:營業額=常數 珍珠奶茶:營業額=常數+B1*D珍珠
椰果奶茶:營業額=常數+B2*D椰果 鴛鴦:營業額=常數+B1*D珍珠+B2*D椰果)
會互相影響的話則表示成
鴛鴦:常數+B1*D珍珠+B2*D椰果+B3*D3(珍珠˙椰果)
是這個意思嗎?
6F:推 Pieteacher: Treatment code,sum code, helmet Code 04/22 02:50
不好意思請問這是指?
※ 編輯: QooHo (1.175.125.61), 04/22/2016 03:27:09
7F:→ andrew43: 沒誤會你表達的方式的話,沒錯。 04/22 04:32
8F:→ andrew43: 另,虛擬變數不是只有一種方法,你Google P板友提供的 04/22 04:34
9F:→ andrew43: 那些關鍵字字看看吧。 04/22 04:34
10F:→ andrew43: 這幾個關鍵字在不平衡設計就很重要。不同的code也會使b 04/22 04:40
11F:→ andrew43: eta有不同的意義。 04/22 04:40
12F:→ andrew43: 更正,無論樣本數是否平衡,都很重要……一時腦殘。 04/22 05:38
13F:→ andrew43: 在拆解變方時要小心;但如果採用迴歸解,那就沒關係了。 04/22 05:47
14F:→ andrew43: 但我還是建議在二因子以上先不用 treatment code,免得 04/22 05:52
15F:→ andrew43: 解讀上出錯。 04/22 05:52
16F:→ QooHo: 好的 謝謝你>< 我會注意 04/24 15:36