作者saltlake (SaltLake)
看板Statistics
标题[问题] 混用独立和配对的学生分布测试
时间Thu Sep 13 15:27:33 2018
能否混用独立的和配对的学生t分布(Student t distribution)
的测试方法而得到另一个可用的统计测试方法?
学生t分布的测试常有独立的和配对的这两种测试方法。独立测试
取样方便,但是样本可能混有拟测试的变因以外的变因。配对测试
(Paired Test)能排除一些非拟测试变因以外的变因,但是样本需要
特别挑选成对的,取样设计较麻烦且可能取不到足够数目的样本。
那麽能否混用这两种测试而兼顾其优点?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.136.59.79
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1536823656.A.2B4.html
1F:→ andrew43: 有些经典的实验设计并不是全然独立或全然相依的采样方式 09/13 17:04
请问有甚麽书或论文有这种方法的探讨?
※ 编辑: saltlake (220.136.59.79), 09/13/2018 20:03:45
2F:→ andrew43: 我觉得实验设计的专书可以翻一翻,对此问题可能会有新 09/13 20:15
3F:→ andrew43: 的体会。 09/13 20:15
4F:→ andrew43: 如果你看过的实验设计不多,很推荐自修实验设计。 09/13 20:17
5F:→ recorriendo: 先定义清楚你说"混用"是什麽意思... 09/14 04:23
6F:→ recorriendo: 搞错重点了 取样、控制变因 这都是实验设计的问题 09/14 04:24
7F:→ recorriendo: between-subjects和within-subjects本来就是不同的 09/14 04:25
8F:→ recorriendo: effects 你研究的问题是什麽effect自己要先想清楚 09/14 04:27
9F:→ recorriendo: 统计只是量化effect的SOP程序而已 研究问题的概念要 09/14 04:31
10F:→ recorriendo: 先厘清 才有对应适合的程序 还是老话一句: 先想清楚 09/14 04:32
11F:→ recorriendo: 问题是什麽 再来想哪个统计方法可以回答这个问题 09/14 04:38
12F:→ recorriendo: 不是反过来: ㄟ有新奇统计方法 来跑跑看会发生什麽 09/14 04:43
13F:→ yhliu: 我不很了解你的意思, 变因如何影响样本结构(抽样设计)? 09/24 05:15
14F:→ yhliu: 成对样本或独立样本是样本结构或抽皮设计的不同而产生的. 09/24 05:17
15F:→ yhliu: 你的样本又是怎麽一回事, 怎麽样的非独立非成对的样本? 09/24 05:19
16F:→ yhliu: 倒是有一种可能是按成对样本抽样, 却因有些原因导致成对观 09/24 05:21
17F:→ yhliu: 测值(实验值)的遗失. 如是, 则耍考虑一个严重问题: 这种遗 09/24 05:23
18F:→ yhliu: 失可认为是"完全随机遗失" 吗? 若是, 请用资料遗失的统计程 09/24 05:25
19F:→ yhliu: 序处理, 若否, 则伯产生偏误, 甚至是很严重的偏误. 09/24 05:26
20F:→ yhliu: 至於如果有相依但非成对样本, 在没有偏误顾虑之下, t 检定 09/24 05:28
21F:→ yhliu: 倒是可以修订如下: (1) 分子是 Xbar-Ybar, (2) 分母是 09/24 05:30
22F:→ yhliu: Var(Xbar-Ybar) 的估计, 这需看样本实际结构(如何抽样)而定 09/24 05:32
23F:→ yhliu: (3) 计算 t = (Xbar-Ybar)/sqrt(est.var(Xbar-Ybar)) 09/24 05:34
24F:→ yhliu: (4) 自由度用两样本之样本数较小者减去1. 09/24 05:36
比方说很常见的、测试某个教学方法会否提升学生学习某个课题的效果之实验。
设计如下:
首先找两个班级的学生,让他们做同样的考试卷,然後老师批阅分数。假设学生
所得的分数反映她/他对这个课题的理解程度,那麽我们应该挑选同分的学生配对
,一个接受既有教学法(控制组),另一个接受新教学法(实验组)。当然我们不能
只取一组学生实验,而需要把得到不同成绩的学生组都纳入样本,以显示教学法
不是只对某个特定分数或某范围特定分数的学生有效。
对控制组和实验组都取足够样本之後,让他们分别接受既有和新教学法。之後再
让他们做考卷,以观察学习後考试成绩提升或下降的统计显着性,以便判别新教学
法到底比既有的更好还是更差或是一样。
理想上我们在初次考试时候,对每个分数都能找到配对的学生。但是万一找不到呢
? 是坚持只拿有配对学生的"纯粹"配对样本,还是可以混入无法配对的学生样本?
※ 编辑: saltlake (114.44.193.228), 09/24/2018 22:07:07
25F:→ yhliu: 如你说的例子, 把它数学化就是说: 原本成对观测值的群体中 09/27 06:36
26F:→ yhliu: 有些是没有配对观测值的. 传统方法不去考虑没有配对的, 只 09/27 06:38
27F:→ yhliu: 从配对完整的群体抽样. 你想把没有配对观测值的也考虑进来. 09/27 06:40
28F:→ yhliu: 这可以想像抽样群体中含有 missing value, 和你抽样後有 09/27 06:41
29F:→ yhliu: missing 其实是一样的, 你可能确定群体中 missing 的发生是 09/27 06:43
30F:→ yhliu: completely random 的吗? 否则没有配对的拿什麽来比? 09/27 06:45
31F:→ yhliu: 至於你说的具体案例, 没有配对的应是极优或极劣表现的学生, 09/27 06:47
32F:→ yhliu: 其余的, 初试成绩不过是一个参考, 一个范围内是有效的, 太 09/27 06:48
33F:→ yhliu: 细微的差距根本没意义, 而大区分不会找不到配对. 再者, 像 09/27 06:50
34F:→ yhliu: 这样的例子也不会简单仗个成对或独立样本 t 检定, 而会用 09/27 06:52
35F:→ yhliu: blocking completely random 实验搭配 ANOVA, 或采用 09/27 06:54
36F:→ yhliu: ANCOVA 的统计程序来处理. 09/27 06:56