看板Statistics
标 题Re: [问题] Monte carlo and bootstrap
发信站无名小站 (Fri Sep 1 08:17:23 2006)
转信站ptt!Group.NCTU!grouppost!Group.NCTU!wretch
※ 引述《[email protected] (htio)》之铭言:
> ※ 引述《[email protected] (老怪物)》之铭言:
> : 甚麽样的近似估计? 估计甚麽?
> ^^^^^^^^^^^^^^^^^^^^^^^^
> 抱歉,我观念模糊,就是不太懂罗.真的不太懂拉.
Monte Caelo 是用在计算 (估算一个明确的量),
而不是用在估计统计上谈的未知参数.
> : 为甚麽?
> : 先把 Monte Carlo 真正用在甚麽地方弄清楚吧!
> : 也去了解一下 bootstrap 究竟怎麽做吧!
> : 怎麽做的都说不清楚, 弄一堆名词唬人?
> 比如说:我们现在有一堆sample, (x1,y1),(x2,y2),(x3,y3)...(xn,yn)
> 我们现在要估计R相关系数,我们当然会用样本的r相关系数去算.
> 可是我们并不知道r的抽样分配,同时也不知道r统计量的精确度.
> 我们彩取bootstrap估计.
> 1:) 从原样本(x1,y1),...(xn,yn)自重抽样取k组,样本数为n的样本
> (k组boostrap sample,建议k至少是200以上)
> 2:) 每组样本算出各自的r相关系数.我们得到k个r相关系数.
> 3:) 然後我们根据k个r相关系数做一个直方图,
很好! 描述很清楚了. 但是, 如果不把这程序和目的的连
结关系弄清楚, 也是白说.
> 直方图在bootstrap 样本够大的时候,形成一个舆真实r抽样分配的图形.
错!
"样本够大" 是甚麽意思?
n 够大? 或 k 够大?
k "200以上" 算是够大吗?
> 如果我们要求r的精确度,我们可以用boostrap estimate of standard error
从一个已知分布抽样, 以估算该分布的某几个基本特徵如
平均数及标准差, 可能 k≧200 够了? 但若说要看这个分
布的 "真实图形", k=200 够吗? 例如要看这分布在特定
范围的比例(机率) p, 模拟结果之样本比例相对误差是
CV = √[(1-p)/(kp)]
K=400, p=0.1 时 CV = 15%
p=0.2 时 CV = 10%
p=0.3 时 CV = 7.6%
p=0.5 时 CV = 5%
要评估样本分布与真实分布的差异, 总不能只看分布中心.
若希望在 p=0.1 时变异系数不超过 5%,至少要抽 k=3600
个样本!
再者, bootstrap 方法是不可能得到统计量的正确抽样分
布的! 即使 k=100000000, 能使模拟的分布很接近 "实际"
分布; 这里需弄清楚 bootstrap 样本对应的统计量(如 r)
的 "实际" 分布指的是甚麽?那是以大小为 n 的一个实际
样本资料当群体时 r 的抽样分布, 不是我们真正的目标!
统计量(如本例的 r)正确的抽样分布是根据真实群体来的.
因此, 若原样本分布 (大小为n的那个实际观测到的样本)
与真实的群体分布相差太多, bootstrap 根本不可能得到
接近正确抽样分布! 因此 n 小时做 bootstrap 是很危险
的!
--
◢ 川◣ │││││ 您在找统计版吗? 竭诚邀请您加入 Statistics!
▃▅▃▅▆ ◣
││││ 无名小站 telnet://wretch.twbbs.org
(cat▍_/ ▲ 、 ││ 成大计中站 telnet://bbs.ncku.edu.tw
▊ ▊Moon◤▍▍▄▂ │ 交大次世代 telnet://bs2.twbbs.org
▃─ _▍_ ◣▌▎▃▅
盈月与繁星 telnet://ms.twbbs.org
▲ ◤  ̄ ◢▂
▃ *Mooncat~ ★未经本人同意请勿转载; 回覆请勿全文引用!
--
夫兵者不祥之器物或恶之故有道者不处君子居则贵左用兵则贵右兵者不祥之器非君子
之器不得已而用之恬淡为上胜而不美而美之者是乐杀人夫乐杀人者则不可得志於天下
矣吉事尚左凶事尚右偏将军居左上将军居右言以丧礼处之杀人之众以哀悲泣之战胜以
丧礼处之道常无名朴虽小天下莫能臣侯王若能守之万物将自宾天地相合以降甘露民莫
之令而自均始制有名名亦既有夫亦将知止知止可以不殆譬道之在天 163.15.188.87海
1F:推 htio:谢谢! ^^ 09/01 11:50
2F:推 c6966:给原PO 有几本是专门讲bootstrap的原文书欧 可以去找来看看 09/01 14:42
3F:→ c6966:不过我不记得确切书名了 研究所论文有用到 所以有大略看过 09/01 14:42