作者tipsofwarren (tipsofwarren)
看板DataScience
标题[问题] Autocorrelation检验LSTM 训练 feature?
时间Wed Feb 13 22:12:28 2019
门外汉有个问题,
假设我打算用 a,b,c 三个变数 使用 DNN or LR 来 预测 y
我先检查 a,y 的 coefficient, 结果发觉是 0,
那我想, 把 a 从 feature set 剔除 应该是很保险的.
但是, 如果我打算用 时间序列模型 来做训练,
换句话说, a,b,c 的时间序列 来预测 y
那用 单纯的 coefficient (a,y) 来检查 a(n) 是否可以踢除 feature set
是否不对?
用白话的来说, 如果 (a,y) 没有相关性, 是否代表 a(n) 与 y 的相关性也是 0?
如果这个推论是不成立的, 那麽我该用什麽样的方法来检验 a(n) 是否适合加入
LSTM 训练的 feature set ?
感谢解惑
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.160.85.189
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1550067150.A.79C.html
1F:→ yougigun: 就算correlation 为 0 也不能拿掉 a 文章以下问题 就不02/14 09:13
2F:→ yougigun: 存在了02/14 09:13
3F:推 yougigun: a(n) 重要性,应该是看a(n)与b(n)and a(n)与c(n) ,如果02/14 12:59
4F:→ yougigun: 其他特徵(b,c)跟它(a)相关性高,为了让特徵变少,是可以02/14 12:59
5F:→ yougigun: 去掉a只看b,c组合,但单纯只看a与y的correlation,可能会02/14 12:59
6F:→ yougigun: 因为没有捕捉到a的高阶特徵导致a与y相关性0,但说不定a^202/14 12:59
7F:→ yougigun: 与y 是高度正相关 所以才会需要DNN去捕捉高阶特徵02/14 12:59
感谢指点。。。
※ 编辑: tipsofwarren (42.73.246.102), 02/14/2019 14:26:28