作者ken83715 (冒烟的宏)
看板DataScience
标题[问题] 时间序列异常值处理
时间Sun Jun 10 12:28:39 2018
使用工具:python
问题内容:
最近在使用类神经做时间序列预测
在资料前处理时
想请问大家对於时间序列中的异常值是如何处理呢
假设有每天的资料 很多天 每天有一些规律
那算出每天5点的平均跟标准差
之後只要5点的资料超过标准差算是异常值
那直接移除掉把剩下的接起来是合理的吗
或者是补一个平均值给它呢?
还是有别的作法~
谢谢~
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.41.60.199
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1528604922.A.7CC.html
1F:推 siscon: 乱补一通就好了吧 看你要直接补平均还是用个Gaussian随机 06/11 02:23
2F:推 goldflower: 如果missing没有真的很多 我做一个类似问题的结果是 06/14 03:29
3F:→ goldflower: 各种补值方法没有显着差异 06/14 03:29
4F:→ goldflower: 试过补个没看过的值 补平均值 补0 利用embedding 06/14 03:31
5F:→ goldflower: 做mask 利用NN补值 这些其实在资料够多下都差不多 06/14 03:31