作者saltlake (SaltLake)
看板Statistics
標題[問題] 混用獨立和配對的學生分布測試
時間Thu Sep 13 15:27:33 2018
能否混用獨立的和配對的學生t分布(Student t distribution)
的測試方法而得到另一個可用的統計測試方法?
學生t分布的測試常有獨立的和配對的這兩種測試方法。獨立測試
取樣方便,但是樣本可能混有擬測試的變因以外的變因。配對測試
(Paired Test)能排除一些非擬測試變因以外的變因,但是樣本需要
特別挑選成對的,取樣設計較麻煩且可能取不到足夠數目的樣本。
那麼能否混用這兩種測試而兼顧其優點?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.59.79
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1536823656.A.2B4.html
1F:→ andrew43: 有些經典的實驗設計並不是全然獨立或全然相依的採樣方式 09/13 17:04
請問有甚麼書或論文有這種方法的探討?
※ 編輯: saltlake (220.136.59.79), 09/13/2018 20:03:45
2F:→ andrew43: 我覺得實驗設計的專書可以翻一翻,對此問題可能會有新 09/13 20:15
3F:→ andrew43: 的體會。 09/13 20:15
4F:→ andrew43: 如果你看過的實驗設計不多,很推薦自修實驗設計。 09/13 20:17
5F:→ recorriendo: 先定義清楚你說"混用"是什麼意思... 09/14 04:23
6F:→ recorriendo: 搞錯重點了 取樣、控制變因 這都是實驗設計的問題 09/14 04:24
7F:→ recorriendo: between-subjects和within-subjects本來就是不同的 09/14 04:25
8F:→ recorriendo: effects 你研究的問題是什麼effect自己要先想清楚 09/14 04:27
9F:→ recorriendo: 統計只是量化effect的SOP程序而已 研究問題的概念要 09/14 04:31
10F:→ recorriendo: 先釐清 才有對應適合的程序 還是老話一句: 先想清楚 09/14 04:32
11F:→ recorriendo: 問題是什麼 再來想哪個統計方法可以回答這個問題 09/14 04:38
12F:→ recorriendo: 不是反過來: ㄟ有新奇統計方法 來跑跑看會發生什麼 09/14 04:43
13F:→ yhliu: 我不很了解你的意思, 變因如何影響樣本結構(抽樣設計)? 09/24 05:15
14F:→ yhliu: 成對樣本或獨立樣本是樣本結構或抽皮設計的不同而產生的. 09/24 05:17
15F:→ yhliu: 你的樣本又是怎麼一回事, 怎麼樣的非獨立非成對的樣本? 09/24 05:19
16F:→ yhliu: 倒是有一種可能是按成對樣本抽樣, 卻因有些原因導致成對觀 09/24 05:21
17F:→ yhliu: 測值(實驗值)的遺失. 如是, 則耍考慮一個嚴重問題: 這種遺 09/24 05:23
18F:→ yhliu: 失可認為是"完全隨機遺失" 嗎? 若是, 請用資料遺失的統計程 09/24 05:25
19F:→ yhliu: 序處理, 若否, 則伯產生偏誤, 甚至是很嚴重的偏誤. 09/24 05:26
20F:→ yhliu: 至於如果有相依但非成對樣本, 在沒有偏誤顧慮之下, t 檢定 09/24 05:28
21F:→ yhliu: 倒是可以修訂如下: (1) 分子是 Xbar-Ybar, (2) 分母是 09/24 05:30
22F:→ yhliu: Var(Xbar-Ybar) 的估計, 這需看樣本實際結構(如何抽樣)而定 09/24 05:32
23F:→ yhliu: (3) 計算 t = (Xbar-Ybar)/sqrt(est.var(Xbar-Ybar)) 09/24 05:34
24F:→ yhliu: (4) 自由度用兩樣本之樣本數較小者減去1. 09/24 05:36
比方說很常見的、測試某個教學方法會否提升學生學習某個課題的效果之實驗。
設計如下:
首先找兩個班級的學生,讓他們做同樣的考試卷,然後老師批閱分數。假設學生
所得的分數反映她/他對這個課題的理解程度,那麼我們應該挑選同分的學生配對
,一個接受既有教學法(控制組),另一個接受新教學法(實驗組)。當然我們不能
只取一組學生實驗,而需要把得到不同成績的學生組都納入樣本,以顯示教學法
不是只對某個特定分數或某範圍特定分數的學生有效。
對控制組和實驗組都取足夠樣本之後,讓他們分別接受既有和新教學法。之後再
讓他們做考卷,以觀察學習後考試成績提升或下降的統計顯著性,以便判別新教學
法到底比既有的更好還是更差或是一樣。
理想上我們在初次考試時候,對每個分數都能找到配對的學生。但是萬一找不到呢
? 是堅持只拿有配對學生的"純粹"配對樣本,還是可以混入無法配對的學生樣本?
※ 編輯: saltlake (114.44.193.228), 09/24/2018 22:07:07
25F:→ yhliu: 如你說的例子, 把它數學化就是說: 原本成對觀測值的群體中 09/27 06:36
26F:→ yhliu: 有些是沒有配對觀測值的. 傳統方法不去考慮沒有配對的, 只 09/27 06:38
27F:→ yhliu: 從配對完整的群體抽樣. 你想把沒有配對觀測值的也考慮進來. 09/27 06:40
28F:→ yhliu: 這可以想像抽樣群體中含有 missing value, 和你抽樣後有 09/27 06:41
29F:→ yhliu: missing 其實是一樣的, 你可能確定群體中 missing 的發生是 09/27 06:43
30F:→ yhliu: completely random 的嗎? 否則沒有配對的拿什麼來比? 09/27 06:45
31F:→ yhliu: 至於你說的具體案例, 沒有配對的應是極優或極劣表現的學生, 09/27 06:47
32F:→ yhliu: 其餘的, 初試成績不過是一個參考, 一個範圍內是有效的, 太 09/27 06:48
33F:→ yhliu: 細微的差距根本沒意義, 而大區分不會找不到配對. 再者, 像 09/27 06:50
34F:→ yhliu: 這樣的例子也不會簡單仗個成對或獨立樣本 t 檢定, 而會用 09/27 06:52
35F:→ yhliu: blocking completely random 實驗搭配 ANOVA, 或採用 09/27 06:54
36F:→ yhliu: ANCOVA 的統計程序來處理. 09/27 06:56