作者totolink (吐吐林克)
看板R_Language
标题[问题] 回归的预测问题
时间Mon Aug 17 12:13:45 2020
大家好,想请教一个回归问题
一般在写回归的语法是
lm(y~x1+x2+x3...),直接将变数名称写上。
但因为实作牵涉变数选择的问题
我的写法是用矩阵的方式
lm(data[,7]~data[,variable])
data是1000*7的矩阵,第7个是反映变数
variable是数字向量,作为变数选择的指标
例如variable=c(1,2,4)是选取x1,x2,x4作为解释变数
这样的写法虽然一样可以建模型但没办法顺利预测测试集
我的测试集是200*7的资料集
用predict预测会给警告讯息说新资料笔数只有200和原始资料笔数不同
并且回传的预测结果是建模型那1000笔资料的fitted.value
这样的状况只有在使用矩阵写lm时会产生,一般写法就没问题
目前只想到提取模型系数自己算的解决方案,请问是否有方法可以解决这样的问题呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.140.99.88 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1597637629.A.7D7.html
1F:推 andrew43: 我会直接提出系数和新资料用矩阵乘法,自变数再多也不 08/17 12:45
2F:→ andrew43: 算麻烦。 08/17 12:45