作者QooHo (Qooo)
看板Statistics
标题[问题] 虚拟变数的设定
时间Fri Apr 22 01:24:34 2016
大家好
想请问关於虚拟变数的设定问题
看到的虚拟变数设置好像都是N个类别设成N-1个变数
譬如说
考量不同饮料销售量对於营业额的影响
第一类:珍珠奶茶 第二类:椰果奶茶 参考值:奶茶(都不加)
关系就像
d1(加珍珠) d2(加椰果)
珍珠奶茶 1 0
椰果奶茶 0 1
奶茶 0 0
营业额=常数+B1*d1+B2*d2 这样
那想请问如果加入一品项为鸳鸯奶茶(有加珍珠又有加椰果)
这样是否能表示为
d1(加珍珠) d2(加椰果)
珍珠奶茶 1 0
椰果奶茶 0 1
奶茶 0 0
鸳鸯奶茶 1 1
关系式同上
还是一定要表示为
d1(加珍珠) d2(加椰果) d3(加珍珠跟椰果)
珍珠奶茶 1 0 0
椰果奶茶 0 1 0
奶茶 0 0 0
鸳鸯奶茶 0 0 1
营业额=常数+B1*d1+B2*d2+B3*d3 呢
另外想请问(1)加珍珠、椰果跟鸳鸯都是各+5元
(2)加珍珠跟椰果是+5元 加鸳鸯=珍珠+椰果各一份=10元
这样对设定方式会有影响吗?
非常谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.175.125.61
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1461259477.A.759.html
※ 编辑: QooHo (1.175.125.61), 04/22/2016 01:25:02
1F:→ andrew43: 後者。 04/22 02:19
2F:→ andrew43: 前者会变成二因子设计,但和你的例子牛头不对马嘴。 04/22 02:37
3F:→ andrew43: 但如果你变成二因子:有无珍珠与有无椰果,前者就对了。 04/22 02:38
4F:→ andrew43: 不过模型可能要加考虑交互作用项 04/22 02:39
5F:→ andrew43: 此外若不是平衡设计,0-1的虚拟变数有其它问题 04/22 02:42
非常谢谢你
我要的0跟1 应该是指有无椰果没错
这样如果两者互不影响表示成
营业额=常数+B1*D珍珠+B2*D椰果
(奶茶:营业额=常数 珍珠奶茶:营业额=常数+B1*D珍珠
椰果奶茶:营业额=常数+B2*D椰果 鸳鸯:营业额=常数+B1*D珍珠+B2*D椰果)
会互相影响的话则表示成
鸳鸯:常数+B1*D珍珠+B2*D椰果+B3*D3(珍珠˙椰果)
是这个意思吗?
6F:推 Pieteacher: Treatment code,sum code, helmet Code 04/22 02:50
不好意思请问这是指?
※ 编辑: QooHo (1.175.125.61), 04/22/2016 03:27:09
7F:→ andrew43: 没误会你表达的方式的话,没错。 04/22 04:32
8F:→ andrew43: 另,虚拟变数不是只有一种方法,你Google P板友提供的 04/22 04:34
9F:→ andrew43: 那些关键字字看看吧。 04/22 04:34
10F:→ andrew43: 这几个关键字在不平衡设计就很重要。不同的code也会使b 04/22 04:40
11F:→ andrew43: eta有不同的意义。 04/22 04:40
12F:→ andrew43: 更正,无论样本数是否平衡,都很重要……一时脑残。 04/22 05:38
13F:→ andrew43: 在拆解变方时要小心;但如果采用回归解,那就没关系了。 04/22 05:47
14F:→ andrew43: 但我还是建议在二因子以上先不用 treatment code,免得 04/22 05:52
15F:→ andrew43: 解读上出错。 04/22 05:52
16F:→ QooHo: 好的 谢谢你>< 我会注意 04/24 15:36