看板Statistics
標 題Re: [問題] 請問變異數分析與迴歸
發信站次世代BS2 (Fri Nov 18 19:29:53 2005)
轉信站ptt!Group.NCTU!grouppost!Group.NCTU!BS2
關於 factor 與 dummy variables 的問題.
一個 k 分類的屬質變數(factor), 在應用複迴歸程序時,
需要建立 k-1 個虛擬變數來代表它。
例如: 屬質變數 "季節" 分四季: 春/夏/秋/冬,
季 節
虛擬變數 春 夏 秋 冬
X1 1 0 0 0
X2 0 1 0 0
X3 0 0 1 0
以上是以 "冬" 為 baseline, 因此 X1, X2, X3 的係數,
分別代表對應類別(春/夏/秋)相對於 baseline category
"冬" 的差異。
一般做 ANOVA 模型時, factor 的各 level (category)
有各自的 effect 參數, 但這些參數若未加限制條件則是
不可估的 (所以 general linear model 中會談甚麼參數
函數可估的問題). 一個廣泛採用的限制是: sum to zero.
這相當於定義下列 dummy variables 用於迴歸模型:
Effect coding 春 夏 秋 冬
Z1 1 0 0 -1
Z2 0 1 0 -1
Z3 0 0 1 -1
迴歸模型上列 dummy variables 的方法是另一限制:某一
level 的 effect 設定為 0. 設為 0 就是比較的 baseline,
一般迴歸分析中以 indicator 為 dummy variable, 如前
述 X1, X2, X3, 是以 baseline category 為比較基準;
ANOVA 採 sum to zero, 就是以 "平均" 為比較基準。
以上, 參見 telnet://bbs.wretch.cc 的 Statistics 版
2003.11.28 "屬質變數與虛擬變數" 討論串.
--
來自統計專業的召喚...
交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率)
無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區)
成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區)
盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話)
批踢踢實業站 telnet://ptt.twbbs.org Statistics (統計學及統計軟體版)
--
▄▄▄▄▄▄▄ ▄▄▄▄ ▄▄▄▄▄▄ <telnet://bbs.cs.nctu.edu.tw>
█▄▄▄▄█ █ ▄▄▄▄▄█ Player: yhliu
▄█▄▄▄▄█ ▄▄▄█ █▄▄▄▄▄ From: 163.15.188.87
☆ 次世代BS2 ☆ 可申請個人板
150MB 超大相簿 http://pic.bs2.to 資訊人 250MB