作者tipsofwarren (tipsofwarren)
标题Re: [心得] 分享 金融开源data package
时间Thu Feb 21 15:23:56 2019
刚刚看了一下 GRU_LSTM_demo.py,
有个疑问...
print(' 归一化 ')
scaler = MinMaxScaler(feature_range=(0, 1))
stock_price = scaler.fit_transform(stock_price)
print(' 取 80% data 当作 training data, 20% data 当作 testing data 做模型验证 ')
train_size = int(len(stock_price) * 0.8)
test_size = len(stock_price) - train_size
train, test = stock_price[0:train_size,:], stock_price[train_size:len(stock_price),:]
这边的顺序是不是有商讨的空间?
应该是
1. 取 80% 当TrainSet, 并且 normalize (并且记下 normalize 的参数, 如 mean/std)
2. 剩下的 20% (暂且称为 dev-test set) 应该用 step 1 的 normalize 参数
去做 标准化, 然後再丢进去 step 1 所获得的 model 来计算 loss.
我还有个问题, 直接用 close price 当作 target 应该 也有商讨空间...
应该改为 "相对值" 吧?
拍谢, 我弱弱的, 有讲错请更正...
※ 引述《f496328mm (123)》之铭言:
: ※ [本文转录自 Python 看板 #1SRLbpwt ]
: 作者: f496328mm (123) 看板: Python
: 标题: [心得] 分享 金融开源data package
: 时间: Wed Feb 20 21:43:12 2019
: https://github.com/linsamtw/FinMind
: 分享我开发的 package,金融 data open source,超过10种金融数据,
: 可直接 pip3 install FinMind
: 包含台股股价、美股股价、台股个股外资买卖、融资融券、财报
: G7 国家汇率、央行利率、债券 ( G7 是7大工业组织 )
: 金价、油价、能源期货价格
: 并提供 DL ( LSTM ) 预测股价范例
: https://github.com/linsamtw/FinMind/tree/master/Mining
: 文件 https://linsamtw.github.io/FinMindDoc/
: ps : 目前在开发视觉化,如果有人有兴趣合作,可以私信我
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.116.34.120
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1550733838.A.842.html
※ 编辑: tipsofwarren (122.116.34.120), 02/21/2019 15:25:10
1F:推 keepxha: 1.先分出训练集再做normalization 02/21 15:43
2F:推 keepxha: 最後预测5天後,再一天的股价,用的是收盘价? 02/21 15:46
3F:推 keepxha: 还蛮直觉的呀 哈 02/21 15:48
让子弹再飞一毁儿... 看看大家怎麽说.
个人认为要用"相对值", 可以用 N 日均价当作基准, 训练完之後再行返推绝对值.
用绝对值的话, 股价 100 涨一元 vs 200 涨 两元应该是一样的意思, 用
绝对值却是看到 股价 100 vs 200 是不一样的.
※ 编辑: tipsofwarren (122.116.34.120), 02/21/2019 15:53:20
4F:推 keepxha: 意思是用收盘的涨跌%数才对? 02/21 15:56
其实包含 feature 也该 %%% 比较好... 老鲁门外汉
请大家多指点...
※ 编辑: tipsofwarren (122.116.34.120), 02/21/2019 15:59:56
5F:推 s3714443: 是,不能预测实际股价 02/21 17:02
6F:推 f496328mm: 你是对的,我 demo 只是提供一个分析的参考 02/21 19:45
7F:→ f496328mm: 只用股价去建 model 02/21 19:45
8F:→ f496328mm: 实际上,我收集超过10种 data,就是希望用所有 data 02/21 19:45
9F:→ f496328mm: 建模 02/21 19:45