作者evilove (願意感動就是一種享受)
看板Statistics
標題[問題] 比較樣本、非樣本與母體
時間Mon Jun 14 23:23:20 2021
通常我們比較樣本與母體的分布時是想知道樣本的代表性
比較樣本與非樣本的分布時有甚麼意義嗎?
譬如1000所學校有300所學校加入某實驗
那我們比較這300所與剩餘的700所在學校特性上的差異
這樣有意義嗎?
謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.86.146.132 (美國)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1623684202.A.D5D.html
1F:推 hank4465: 從你舉的例回答,如果抽樣的300所跟剩餘的700所分配情形 06/15 03:18
2F:→ hank4465: 差異太大,會導致外推性不足,那就不是一個好的抽樣設計 06/15 03:18
3F:→ evilove: 請問外推性是甚麼意思? generalization? 06/15 04:07
4F:→ evilove: 如果樣本分布與母體分布沒有差異但是與非樣本有差異,要 06/15 04:10
5F:→ evilove: 麼解讀呢?謝謝您 06/15 04:11
6F:→ andrew43: 做了簡單t-test在同源母體的模擬。300vs700做法沒問題, 06/15 14:10
7F:→ andrew43: 300vs1000(300包括在1000內)會type I error過大。 06/15 14:12
8F:→ andrew43: 不過你的結果倒是反過來 XD 06/15 14:13
9F:→ andrew43: 更正,會type I error過小。說反了。符合你的結果。但 06/15 14:17
10F:→ andrew43: 300 vs 700才是對的方法吧。部份重覆樣本相比有問題。 06/15 14:19
11F:→ andrew43: 因此,300vs1000的不顯著結果可能只是型二錯誤。 06/15 14:26
13F:→ evilove: 可是一般檢驗樣本代表性都是300vs1000,怎麼解讀300vs700 06/15 22:18
14F:→ evilove: 謝謝您 06/15 22:18
15F:→ andrew43: 這我不清楚。或許是因為數量比例非常懸疏? 06/15 22:34
16F:→ andrew43: 但我還是覺得這是有問題的。把抽不抽中視為一個因子,則 06/15 22:35
17F:→ andrew43: 放在一個多因子模型中非常自然。 06/15 22:36
18F:→ andrew43: 例如,1000硬幣各投一次分300|700二組,做2*2卡方不會是 06/15 22:38
19F:→ andrew43: 300vs1000的正面機率而是300vs700的。 06/15 22:39
20F:→ andrew43: 光是獨立樣本前題就說不過去惹。 06/15 22:41