作者azzc1031 (azzc1031)
看板Statistics
标题[问题] 计量跑复回归的问题
时间Sat Jan 3 16:59:37 2015
这次计量的作业,是要用SAS软体跑复回归
由於主题不限,我找了比较生活化的题材
我输入爱文芒果的价格(Y),气温(X1),雨量(X2),日照时数(X3)
一跑,发现调整後R-square才0.12........囧
後来改成观光收入(Y),历年来台人数(X1)
其他变数还没想到,总之先跑跑看
一跑,调整後R-square高达0.98
问了教授,他说一个好的回归,应落在0.7-0.8之间
所以太高也不行....
我後来发现,找资料,跑回归,分析变数间关系还算容易
反而是一开始如何订题材最难
所以想问大家有什麽好题材呢? 感激不尽!!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.163.245.180
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/Statistics/M.1420275580.A.298.html
1F:→ bcs: R-adj那麽高,检查一下时间序列的spurious regression 01/03 20:34
2F:→ yhliu: R^2 高不是不行. 问题的关键是为什麽会有那麽高的 R^2, 所 01/05 08:58
3F:→ yhliu: 考虑的模型是否具有 "解释" 的效果, 或 "预测" 的功能. 01/05 08:59
4F:→ yhliu: 当然, 在使用时间数列时, 各时间数列的共同趋势造成的虚假 01/05 09:00
5F:→ yhliu: 相关现象也是要考虑的. 01/05 09:00
6F:→ yhliu: 如果模型是真的有意义的, 研究者应巴不得 R^2 在 0.99 以上 01/05 09:02
7F:→ yhliu: 那代表反应变数的变异几乎完全可被解释, 代表不可测的误差 01/05 09:03
8F:→ yhliu: 很小. 当然事实上这种情形是不可得的. 01/05 09:04
9F:→ yhliu: 如本例, 观光收入 与 来台人数, 本就是一种现象的两种量度, 01/05 09:05
10F:→ yhliu: 有直接关系, 有高相关本是必然. 这样的 "回归模型" 能说明 01/05 09:06
11F:→ yhliu: 什麽现象? 能用於预湔什麽? 01/05 09:07
12F:→ yhliu: 至於 R^2 偏低的模型, 表示根本未找到影响反应变数的重要 01/05 09:08
13F:→ yhliu: 解释变数, 这样的模型当然是缺乏说服力的. 01/05 09:09
14F:推 shaneyeh: Overfit 01/06 13:07