作者Tarantino (Bad Motherfucker)
站内Statistics
标题[问题] 线性回归的斜率准确度
时间Tue Oct 28 19:02:20 2014
看到一个方法 想请教大家意见
一般来说
运用两组对应的30笔的资料来计算回归
可得到他的回归线的斜率
而这斜率的95%信赖区间是此斜率加减约两倍的标准误
代表95%的信心水准下 真实斜率会落在此区间内
但若是从30笔中任意取两笔出来 将这两笔的X变数相减 y变数也相减
就可以得到相对应的dx和dy
这样可以把样本从30个 增加到30*29/2=435笔 (30笔中任取两笔 共有435种组合)
以这435个资料点所计算出来的P-value会减少很多
斜率的标准误也会减少 所以95%的信赖区间也会缩小
因此可以说算出的斜率结果更为显着
但是总觉得怪怪的 为什麽只靠这样相减就可以增加样本数
这方法有甚麽问题吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.132.39.106
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/Statistics/M.1414494143.A.245.html
1F:→ yhliu: 群体是什麽? 30组数字? 10/28 23:02
2F:→ yhliu: 30组数字的两两组合并不是相互独立的, 你的 "标准误" 并不 10/28 23:04
3F:→ yhliu: 正确. 10/28 23:04
是30组(x,y)
请问标准误不正确是指以此方法算出的标准误不正确吗? 还是指我的定义说错了?
※ 编辑: Tarantino (1.34.39.236), 10/29/2014 20:50:40
4F:→ yhliu: 30组 (x,y) 两两组合计算斜率, 再以其平均当回归线之斜率, 10/31 18:48
5F:→ yhliu: 此平均斜率是否为群体模型之斜率的不偏估计有待探讨; 而这 10/31 18:50
6F:→ yhliu: C(30,2) = 435 个斜率彼此之间有相关, 因此, 并不能以这些 10/31 18:52
7F:→ yhliu: 斜率的标准差除以 √435 当平均斜率之标准误. 10/31 18:53