看板Statistics
標 題Re: [問題] 初學者問個關於One-way Anova問題
發信站無名小站 (Thu Sep 28 10:51:31 2006)
轉信站ptt!Group.NCTU!grouppost!Group.NCTU!wretch
實際上既然只看一本教本, 這資料及分析結果要代表甚麼,
是一個問題! 就好像拿一個班級的學生資料來做分析, 結
果能化表的是甚麼?
這資料的設計, 就好像拿一個班級的學生, 依某種標準分
類將學生分成三組, 然後觀察每一個學生在某些日子是否
有某種行為, 例如缺課. 而要問:
三種學生的行為有沒有顯著差異?
觀察的 "某些日子" 是 "研究者" 不知採用甚麼標準選定
的. 數據是每一位 "觀察日數", "有缺課日數" 及 "有缺
課日數的比例".
然後, 被提出的問題是: 做 ANOVA 的變項是 "百分比",
還是 "缺課日數"+"觀察日數"+"百分比"?
不談抽樣及代表性的問題 --- 雖然那是最重要的問題!
「"特殊字的數量"+"全部字的數量"+"百分比" 全部一起比」
是甚麼意思?
實際的資料可說只有一個: 特殊字數. 而 "全部字數" 是
人為的, 它影響特殊字數的多寡.
就 ANOVA 的條件而言, 要求:
各觀測值相互獨立、變異數相等、不能太偏離常態
常態性且不管(這資料當然不符合!) 獨立性就閉著眼晴假
設成立吧! 但 "變異數相等" 這條件無論如何是無法唬過
去的! 因此, 要做 ANOVA, 去找看看是否有能處理不等變
異數的軟體吧! (別問我! 我不知道.)
假設考慮前面所舉學生缺課的例子:
(1) 假設每位學生是抽查實驗觀察期間中的一些日子, 抽
查幾天是研究者決定, 但抽樣是採在觀察期間中以隨
機方式為之. 而且各學生的抽樣是互不相干的. 並且,
假設 "實驗觀察期間" 夠長, 使得實際觀察日數相對
於此期間的日數, 比例很小, 例如小於10%.
(2) 假設 "缺課" 與否是明確定義的, 不因不同日子而不
同, 也不因不同學生而有差別.
(3) 假設基本上只是要看
該班三類型學生的缺課率是否不
同.
(4) 假設影響該班學生缺課率的, 只有被考慮的學生類型.
也就是: 該三類型學生, 同一類型學生的缺課率是相
同的. 實際觀測到的 "樣本缺課率" 有差異, 純粹是
因抽樣誤差或隨機誤差.
在這些假設下, 資料及模型如下:
分組 "樣本" 理論缺課率 觀測日數 缺課日數
====== ======= ========== ======== ========
I 1 P1 N11 X11
2 P1 N12 X12
: : : :
: : : :
a P1 N1a X1a
II 1 P2 N21 X21
2 P2 N22 X22
: : : :
: : : :
b P2 N2b X2b
III 1 P3 N31 X31
2 P3 N32 X32
: : : :
: : : :
c P3 N3c X3c
假說:
H0: P1 = P2 = P3
Ha: P1, P2, P3 並非全部一致
檢定:
Pearson 卡方近似, 或 exact test.
模型診斷:
是否同一組內各樣本對應的 "理論缺課率" 是一致的?
[方法] 各 "樣本" 都足夠大時可用卡方近似,否則看
有沒 exact test 的軟體.
--
來自統計專業的召喚...
無名小站 telnet://wretch.twbbs.org Statistics (統計方法討論區)
成大計中站 telnet://bbs.ncku.edu.tw Statistics (統計方法及學理討論區)
盈月與繁星 telnet://ms.twbbs.org Statistics (統計:讓數字說話)
交大資訊次世代 telnet://bs2.twbbs.org Statistics (統計與機率)
★本文未經本人同意請勿轉載; 回覆請勿全文引用, 請僅留下直接涉及部分。
--
夫兵者不祥之器物或惡之故有道者不處君子居則貴左用兵則貴右兵者不祥之器非君子
之器不得已而用之恬淡為上勝而不美而美之者是樂殺人夫樂殺人者則不可得志於天下
矣吉事尚左凶事尚右偏將軍居左上將軍居右言以喪禮處之殺人之眾以哀悲泣之戰勝以
喪禮處之道常無名樸雖小天下莫能臣侯王若能守之萬物將自賓天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦將知止知止可以不殆譬道之在天 163.15.188.87海