作者yhliu (老怪物)
看板Math
标题Re: [机统] 能不能计算期望误差?
时间Thu Mar 31 15:06:22 2011
※ 引述《fish0407 (@_@..)》之铭言:
: 大家好
: 小弟做研究遇到一个问题
: m 个硬币已经翻好正反面,放在黑箱子里,
: 我想取 n (n<=m) 个 sample 中就猜测箱子里有几个正面
: 请问这样可以计算期望误差吗?
: 例如误差范围百分比之类的~
: 应该是个和 n, m 都有关的函数吗?
: 谢谢大家~
设有 N 个硬币,其中 Np 个是正面, 但哪个是正面哪个是
反面观察者不知.
今观察者观看了其中 n 个, 其中 x 个是正面, 则可以猜
测 p^ = x/n, 也就相当於猜测原先 N 个有 Np^ 个正面.
则 E[p^] = p, 即: 假设那 n 个是从 N 个之中随机抽取,
那麽考虑 C(N,n) 种可能样本, 一一计算其 p^ 之後, 这
些 p^ 的平均值等於 p. 所以 E[Np^] = Np.
用 p^ 估计 p, 有多大误差? 最常用的表现误差形式是所
谓 "均方误差":
Mse(p^) = E[(p^-p)^2] = [p(1-p)/n]*(N-n)/(N-1)
当 n<<N, 例如 n<N/10 时, 常把 (N-n)/(N-1) 拿掉, 成
为
Mse(p^) = p(1-p)/n
这就是一般民调、市调在用的公式.
而用 Np^ 估计 Np, 则
Mse(Np^) = N^2 Mse(p^)
另外,也可建立所谓 "区间估计" 或 "信赖区间", 例如一
般民调常用 95% 信赖区间: 基於中央极限定理,用常态分
布近似二项分布, p 的 95% 近似信赖区间是
p^ - 1.96*√Mse(p^) ~ p^ + 1.96*√Mse(p^)
近些年来统计学者发现: 由於常态近似的一些缺陷, 改用
下列公式的信赖区间结果比较好:
假设 (N-n)/(N-1) 这个 "有限群体校正因子" 可忽略,
令 p' = (x+2)/(n+4),
令 v(p') = p'(1-p')/(n+4)
取区间为 p'-1.96*√v(p') ~ p'+1.96*√v(p')
不管是 p 的估计,或 Np 的估计, 都是常见之於各种统计
调查.
--
嗨! 你好! 祝事事如意, 天天 happy! 有统计问题? 欢迎光临统计专业版! :)
成大计中站 telnet://bbs.ncku.edu.tw Statistics (统计方法及学理讨论区)
交大资讯次世代 telnet://bs2.twbbs.org Statistics (统计与机率)
盈月与繁星 telnet://ms.twbbs.org Statistics (统计:让数字说话)
我们强调专业的统计方法、实务及学习讨论, 只想要题解的就抱歉了!
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 125.233.153.172
1F:推 bewilderment:高手~ 04/01 01:31