看板Statistics
标 题Re: [问题] 请问变异数分析与回归
发信站次世代BS2 (Fri Nov 18 19:29:53 2005)
转信站ptt!Group.NCTU!grouppost!Group.NCTU!BS2
关於 factor 与 dummy variables 的问题.
一个 k 分类的属质变数(factor), 在应用复回归程序时,
需要建立 k-1 个虚拟变数来代表它。
例如: 属质变数 "季节" 分四季: 春/夏/秋/冬,
季 节
虚拟变数 春 夏 秋 冬
X1 1 0 0 0
X2 0 1 0 0
X3 0 0 1 0
以上是以 "冬" 为 baseline, 因此 X1, X2, X3 的系数,
分别代表对应类别(春/夏/秋)相对於 baseline category
"冬" 的差异。
一般做 ANOVA 模型时, factor 的各 level (category)
有各自的 effect 参数, 但这些参数若未加限制条件则是
不可估的 (所以 general linear model 中会谈甚麽参数
函数可估的问题). 一个广泛采用的限制是: sum to zero.
这相当於定义下列 dummy variables 用於回归模型:
Effect coding 春 夏 秋 冬
Z1 1 0 0 -1
Z2 0 1 0 -1
Z3 0 0 1 -1
回归模型上列 dummy variables 的方法是另一限制:某一
level 的 effect 设定为 0. 设为 0 就是比较的 baseline,
一般回归分析中以 indicator 为 dummy variable, 如前
述 X1, X2, X3, 是以 baseline category 为比较基准;
ANOVA 采 sum to zero, 就是以 "平均" 为比较基准。
以上, 参见 telnet://bbs.wretch.cc 的 Statistics 版
2003.11.28 "属质变数与虚拟变数" 讨论串.
--
来自统计专业的召唤...
交大资讯次世代 telnet://bs2.twbbs.org Statistics (统计与机率)
无名小站 telnet://wretch.twbbs.org Statistics (统计方法讨论区)
成大计中站 telnet://bbs.ncku.edu.tw Statistics (统计方法及学理讨论区)
盈月与繁星 telnet://ms.twbbs.org Statistics (统计:让数字说话)
批踢踢实业站 telnet://ptt.twbbs.org Statistics (统计学及统计软体版)
--
▄▄▄▄▄▄▄ ▄▄▄▄ ▄▄▄▄▄▄ <telnet://bbs.cs.nctu.edu.tw>
█▄▄▄▄█ █ ▄▄▄▄▄█ Player: yhliu
▄█▄▄▄▄█ ▄▄▄█ █▄▄▄▄▄ From: 163.15.188.87
☆ 次世代BS2 ☆ 可申请个人板
150MB 超大相簿 http://pic.bs2.to 资讯人 250MB