作者tipsofwarren (tipsofwarren)
看板DataScience
标题Re: [问题] 时间序列资料的训练集切法
时间Sat Apr 13 23:10:11 2019
有人认为 Cross Validation 并不适合某些情况,
所以提出了 Rolling segmentation on training and test set.
请参考:
https://www.hindawi.com/journals/mpe/2018/4907423/
Fig2:
https://www.hindawi.com/journals/mpe/2018/4907423/fig2/
不确定是否符合你的需要
根据图二:
M 代表 train set, N 代表 test set, M/N 的大小也许又可以是
另外一组 hyper-parameters
原文没有讲得很仔细, 不过我看完的想法应该就是 经由 M & num_steps
组成 sequence 去 train 你的 RNN/LSTM etc, 然後由 N所组成的 sequence 来
获得 cost, 然後依此扫过你的整个 dataset, 然後把 所有 cost 加总,
用以决定最佳的 hyper-parameters. 算是某种 Cross-Validation 的变形吧.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.160.91.133
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1555168216.A.1F4.html
※ 编辑: tipsofwarren (118.160.91.133), 04/13/2019 23:15:52
1F:推 sma1033: 其实就是walking forward analysis 04/13 23:41