作者incessantgas (人生胜利组YA)
看板Statistics
标题[问题] LASSO Regression的另类用法
时间Wed Feb 9 01:17:58 2022
有个LASSO的问题想请教各位。
我的模型基本上是SEM架构,有5个大类别分别为X1, X2, X3, X4, X5,全部用来解释Y,
也就是说,
Y = a0 + a1* X1 + a2*X2 + a3*X3 + a4*X4 + a5*X5 + error
资料上面来说,X1一共有10个变数,X2有15个变数,X3有8个变数,X4有6个变数,X5有12
个变数。目前做法是用Principle Component Analysis (PCA)把每个类别全部缩减成一个
变数,也就是X1到X5。
我的问题是:
1) 有没有可能在每个类别先做LASSO,然後再做PCA。以X1来说,以Y为dep. Var,先
做LASSO缩减到5个变数,接着再利用这5个变数做PCA来得到X1。
2) 直接取X1的10个变数,利用LASSO来计算latent variable,这样同样可以达到变数
缩减的目的。
希望我有把问题描述清楚,欢迎各位的意见,或是有推荐的paper也欢迎分享。
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 98.235.233.212 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1644340680.A.CC0.html
1F:→ recorriendo: SEM本身就可内建CFA结构处理latent variables 02/09 10:30
2F:→ recorriendo: 看不到特别需要加一层lasso的理由 02/09 10:35
3F:→ recorriendo: PCA都不需要 02/09 10:38
4F:→ incessantgas: 有道理耶! 02/09 12:37
5F:→ incessantgas: 其实LASSO需要有dep. var,想想好像跟CFA的概念不同 02/09 12:39