作者evilove (愿意感动就是一种享受)
看板Statistics
标题[问题] 比较样本、非样本与母体
时间Mon Jun 14 23:23:20 2021
通常我们比较样本与母体的分布时是想知道样本的代表性
比较样本与非样本的分布时有甚麽意义吗?
譬如1000所学校有300所学校加入某实验
那我们比较这300所与剩余的700所在学校特性上的差异
这样有意义吗?
谢谢!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 73.86.146.132 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1623684202.A.D5D.html
1F:推 hank4465: 从你举的例回答,如果抽样的300所跟剩余的700所分配情形 06/15 03:18
2F:→ hank4465: 差异太大,会导致外推性不足,那就不是一个好的抽样设计 06/15 03:18
3F:→ evilove: 请问外推性是甚麽意思? generalization? 06/15 04:07
4F:→ evilove: 如果样本分布与母体分布没有差异但是与非样本有差异,要 06/15 04:10
5F:→ evilove: 麽解读呢?谢谢您 06/15 04:11
6F:→ andrew43: 做了简单t-test在同源母体的模拟。300vs700做法没问题, 06/15 14:10
7F:→ andrew43: 300vs1000(300包括在1000内)会type I error过大。 06/15 14:12
8F:→ andrew43: 不过你的结果倒是反过来 XD 06/15 14:13
9F:→ andrew43: 更正,会type I error过小。说反了。符合你的结果。但 06/15 14:17
10F:→ andrew43: 300 vs 700才是对的方法吧。部份重覆样本相比有问题。 06/15 14:19
11F:→ andrew43: 因此,300vs1000的不显着结果可能只是型二错误。 06/15 14:26
13F:→ evilove: 可是一般检验样本代表性都是300vs1000,怎麽解读300vs700 06/15 22:18
14F:→ evilove: 谢谢您 06/15 22:18
15F:→ andrew43: 这我不清楚。或许是因为数量比例非常悬疏? 06/15 22:34
16F:→ andrew43: 但我还是觉得这是有问题的。把抽不抽中视为一个因子,则 06/15 22:35
17F:→ andrew43: 放在一个多因子模型中非常自然。 06/15 22:36
18F:→ andrew43: 例如,1000硬币各投一次分300|700二组,做2*2卡方不会是 06/15 22:38
19F:→ andrew43: 300vs1000的正面机率而是300vs700的。 06/15 22:39
20F:→ andrew43: 光是独立样本前题就说不过去惹。 06/15 22:41