作者middleroad (勤学统计)
看板Grad-ProbAsk
标题Re: [商管] [统计]-不清楚是要估计谁的样本回归线
时间Wed Aug 19 01:03:10 2009
※ 引述《liyu (哩育)》之铭言:
: ※ 引述《middleroad (勤学统计)》之铭言:
: : 请问一下~
: : 回归模型可以写成
: : Yi=β0+β1xi+εi 母体回归线
: : = b0+ b1xi+ ei 样本回归线
: 这边应该是 ^
: yi = b0+ b1xi 样本回归线
: ^
: 而 ei = Yi -yi
: 所以最小平方法就是要让ei^2最小 也就是让Yi -yi最小
: 好让估计值yi最接近Yi
: : 而我们目的是要用样本回归线估计母体回归线
: : 但是最小平方法中,让残差平方和达到最小的目的我就不知道为什麽了
: : 因为ei=Yi-b0-b1xi
: : 假设让ei达到最小好了,也就是ei等於0,这样的话是代表说Yi=b0+b1xi
: ei=0 代表估计值yi=真实质Yi,代表Yi=b0+b1xi 矛盾在哪= =?
Yi=β0+β1xi+εi
= b0+ b1xi+ ei
Yi:真实值 , β0+β1xi:理论值 , εi:真实值与理论值之间的差距,即误差
b0+ b1xi:估计值 , ei:真实值与估计值之间的差距,及残差
而回归的目标是找出母体回归线,即Y=β0+β1x,但因为β0、β1未知,所以要用
b0、b1去估计,所以最小平方法的目的变成了用b0、b1去估计β0、β1
但是如果照你说的话 ei=0 代表估计值yi=真实质Yi,代表Yi=b0+b1xi
这样一来β0+β1xi-b0+ b1xi=εi
代表当残差最小时(ei=0),母体回归线与样本回归线的差距会达到最大(即εi)
这样的话就跟一开始最小平方法的目的被道而驰了不是吗?我是要用样本回归线去match
母体回归线而不是真实值Yi吧?
: : 这样是不是有矛盾呢?
: : 因为原本的目的是要用样本回归线去估计母体回归线,但最小平方和的作法
: : 似乎变成了用样本回归线去估计实际值Yi
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.113.177.105
1F:推 goshfju:不如回到回归线最原始的目的 就是为了预测Y阿 08/19 01:21
2F:→ goshfju:所以让残差达到最小 多少能增加预测Y的准确性 08/19 01:22