作者yanwu0105 (辉飞)
看板DataScience
标题[问题] DNN 回归问题是否需要标准化
时间Wed Dec 19 17:14:50 2018
问题类别:(ex:ML,SVM,RL,DL,RNN,CNN,NLP,BD,Vis,etc...)
DNN
使用工具:(ex:python,Java,C++,tensorflow,keras,MATLAB,etc...)
python
问题内容:
各位大大您好,目前使用DNN对时间序列进行预测
想问一下丢进去模型的训练资料是否有一定要标准化(Normalization)
如果每个feature的区间范围不一样时,肯定需要标准化,
但像是我手边的资料是销售额的时间序列资料,这样是否一定要标准化?
在之前的训练,会发生predict出来的结果,皆预测成同一个值,
不知道是否是因为训练资料被标准化到一定范围,太过接近,
以至於预测结果为同一个值,这样是否是模型没学习好?
麻烦各位大大指教,非常感谢!
附上举例给各位大大参考:
训练资料有Normalization後的预测结果
[0.838, 0.838, 0.838, 0.838, 0.838,
0.838, 0.838, 0.838, 0.838, 0.838]
训练资料没有Normalization,直接丢入模型的结果
[369.643, -1579.206, -1570.955 ,-1001.645, -1721.018,
228.803, -221.869, -1368.03, -1210.812, -225.353]
实际资料:
[-5556.167, -4843.999, -4869.553, -1570.44, 0.0,
-4350.014, 2.387, -3172.07, 0.0, -658.111]
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.119.78.30
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1545210892.A.84A.html
※ 编辑: yanwu0105 (140.119.78.30), 12/19/2018 17:17:25
1F:→ jackwang01: 通常是对feature normalize而不是对label normalize吧 12/19 20:00
2F:→ jackwang01: ?(DNN 的feature我不确定需不需要?) 12/19 20:00
3F:→ ericakcc: 请问是使用DNN一次预测一整条时间序列吗? 12/19 23:01
4F:→ ericakcc: 我的经验是DNN对於这种资料很难train的好 12/19 23:02
5F:→ ericakcc: 可以尝试改成regression的方式(通常需要normalize) 12/19 23:08
6F:推 Kazimir: 我不太相信你有这结果是因为Normalize 建议检查训练过程 12/20 01:19
7F:推 tipsofwarren: categorical feature 不用normalize,余则要。 12/20 10:11
8F:推 zxp9505007: Normalize的结果真的是这样?建议检查code 12/23 17:22