作者phil5566 (5566)
看板Statistics
標題[問題] 模擬資料算估計值的MSE問題?
時間Sun Jun 18 21:36:32 2017
如題
我想請教一個問題
就是計算估計量θ^的MSE問題
這裡的MSE並不是迴歸裡的那個SSE除以自由度的MSE
而是bias(θ^)^2+var(θ^)同時衡量精和準的MSE
以下問題開始
假設產生了3種模擬樣本
第一種n=60(或是120)筆data
第二種n=80(或是240)筆data
第三種n=100(或是360)筆data
(簡單說就是產生data方式一樣
就只是改變樣本數n=60,80,100
或是n=120,240,360
依樣本數不同區分成三種)
每一種n各產生100組模擬樣本,例:100組n=60筆data
每組樣本都可以算出一個θ^,因為模擬的原故所以θ已知
所以可以算bias(θ^)的估計值,即"算100組θ^的平均再扣掉θ"
也可以算var(θ^)的估計值,即"算100組θ^的var"
最後把bias(θ^)的估計值取平方加上var(θ^)的估計值
就是MSE(θ^)的估計值了
問題來了.......理論上應該
n=100的MSE(θ^)估計值<n=80的MSE(θ^)估計值<n=60的MSE(θ^)估計值
或是
n=360的MSE(θ^)估計值<n=240的MSE(θ^)估計值<n=120的MSE(θ^)估計值
模擬結果大部分的數據的確也是和上述結果一樣
但少部分數據呈現
n=80的MSE(θ^)估計值<n=100的MSE(θ^)估計值<n=60的MSE(θ^)估計值
或是
n=240的MSE(θ^)估計值<n=360的MSE(θ^)估計值<n=120的MSE(θ^)估計值
想請教各位高手大大這部分該如何解釋呢?
________________________________________________________
自己目前對於n=60,80,100的case
解釋理由為
1.樣本差距不大
2.MSE是估計出來的所以有隨機性
所以有n=80的MSE(θ^)估計值<n=100的MSE(θ^)估計值<n=60的MSE(θ^)估計值
情形產生
然而對於n=120,240,360的case
解釋理由為
MSE是估計出來的所以有隨機性
所以有n=240的MSE(θ^)估計值<n=360的MSE(θ^)估計值<n=120的MSE(θ^)估計值
情形產生
不知版上高手有無遇過類似這種經驗?
或是有其他更好的解釋及看法?
指教了 謝謝
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.224.31.54
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1497792995.A.C1A.html
1F:→ recorriendo: 本來就會有隨機性啊 例如"n=80的MSE(θ^)"本身遵守 06/19 02:17
2F:→ recorriendo: 一個分布 會得出小數值本來就有一定機率 06/19 02:18
3F:→ phil5566: 感謝回答,不知道還有沒有其它說法? 06/19 17:16