作者sky22485816 (玻利維亞)
看板Stock
標題Re: [標的] 台指大盤 機器學習線仙多
時間Wed May 17 13:53:27 2023
※ 引述《sky22485816 (玻利維亞)》之銘言:
: 1. 標的:台指大盤 (例 2330.TW 台積電)
: 2. 分類:多
: 3. 分析/正文:
: 使用RadiusNeighborRegressor回歸多項技術分析特徵
: 包含價格 RSI KD 成交量... 等等
: 用其找出歷史上相似特徵的收益
: 其高維特徵投影到二維上的分布如下
: 資料時間是2017年6月到現在約1300個交易日
: 藍色點表示20個日後加權指數高於當下
: 紅色則反之
: https://imgur.com/iJfDC0P
: 昨日的點位大概是紅圈圈起來的地方
: 在範圍內有50個鄰居
: 表示曾經有五十個類似昨日的訊號
: 統計分布如下
: https://imgur.com/Okvxllg
: 其中有約75%的鄰居20日後的指數會高於當下
: 平均漲480點
: 歷史上發生的最高虧損約1000點
: 門票
: https://imgur.com/18p253C
因為今天是期貨結算日
明天以後有可能因為別的短週期策略放空
對帳單上的平倉損益會失真
所以提早兩天發文
這篇文的標的還是會在5/19日盤收盤的時候平倉
目前的未平倉損益約為+200點
https://imgur.com/SCz4xdn
另外此策略在5/10號 15473又做多一口 目前未平倉損益+380
是因為在那天也滿足此策略進場條件
只不過因為上次發文的部位還沒有平倉 所以就沒有說
第二個訊號的入場原因一併補充
https://imgur.com/KfYBLiD
那天的數據特徵大約在圖片中黑色圈圈處
歷史上有53個neighbors
其中有85%的數據20日後的指數會高於當下
平均期望損益約400點
https://imgur.com/szpv3Q6
------------------------------------
我的表達能力可能有點差
不過簡單的類比給大家
例如說題目是看身高體重猜測腰圍
身高、體重是特徵,而腰圍就是要迴歸的數據
所以今天一個人他體重是90KG,身高170CM
當你需要預估他的腰圍時
你會去查查 體重在85~95KG,身高165~175CM的人
他們的腰圍平均是多少,來當作你的預測
這大概就是RadiusNeighborRegressor在做的事情
當然還需要對數據做一些前處理,特徵篩選,以及調整超參數之類的
對機器學習有興趣的可以在Youtube搜尋一下台大李宏毅老師
他的課程內容很好,我是他粉絲
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.44.75 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Stock/M.1684302812.A.DEB.html
1F:→ aaaaaaa1 : 有賺錢就是好策略 恭喜賺錢 05/17 13:54
※ 編輯: sky22485816 (122.116.44.75 臺灣), 05/17/2023 13:55:42
2F:推 EHacker : 賺爛 05/17 14:06
3F:推 turtle66 : 恭喜 05/17 14:09
4F:推 fiend0229 : 科學數據進出場蠻厲害的 給推 05/17 14:24
5F:推 SunGuang : 推大數據 05/17 14:39
6F:推 potatochip : 這種研究方式是對的,你會贏 05/17 14:39
7F:推 bryanma : 好難,可不可以發一篇科普 05/17 14:46
8F:推 peacesignv : 好扯 要賺大錢了 05/17 14:51
9F:推 TP62842UL3 : 賺爛 恭喜 05/17 14:53
10F:推 PttNoMoney : 看不懂 05/17 15:02
11F:推 brandonhsu8 : 強 05/17 15:06
12F:推 tanchuchan : 恭喜 05/17 15:11
13F:推 kobe0819 : 厲害 存 05/17 15:23
※ 編輯: sky22485816 (122.116.44.75 臺灣), 05/17/2023 15:38:57
14F:推 qscNERO : 推李老師 05/17 17:13
15F:推 codotsun : 好奇為什麼是看20天後XD 05/17 17:59
16F:→ sky22485816 : 其實就只是一個命題內容而已,要訂什麼題目看自己 05/17 18:01
17F:→ sky22485816 : 喜好,只是做不做得出成果就不確定了 05/17 18:02
18F:推 c123791598 : 的確 每次都是盲盒XD 05/17 18:17
19F:推 glmkk : 有賺錢就是對的策略 持之以恆 05/17 19:50
20F:→ warlocks : 有趣 讚一個 05/17 23:07
21F:推 victorcoo : 想請教你的ML模型在test set準確率有多少 05/20 08:39
22F:→ sky22485816 : 這個有點難說清楚,因為回歸模型預測的是數值。我 05/21 14:38
23F:→ sky22485816 : 並非單純的回歸預測是正值就做多並計算勝率。會有 05/21 14:38
24F:→ sky22485816 : 一個閥值,這個閥值是要調參的,當預測值大於某個 05/21 14:39
25F:→ sky22485816 : 閥值才進行做多或是放空。所以在二維表示的分布圖 05/21 14:39
26F:→ sky22485816 : 上面並不是所有的地方都會進行交易。然後還要考慮 05/21 14:39
27F:→ sky22485816 : 到訊號與訊號之間的間隔如果小於一個月,那你是想 05/21 14:39
28F:→ sky22485816 : 統計所有訊號的總和勝率,還是說你假設就一筆資金 05/21 14:39
29F:→ sky22485816 : ,在第一個訊號沒出場前出現第二個的話得放棄第二 05/21 14:39
30F:→ sky22485816 : 個訊號。如果是後者的話勝率有七成多,但是實際上 05/21 14:39
31F:→ sky22485816 : 有交易到的數量並沒有很多。平心而論這個策略對我 05/21 14:39
32F:→ sky22485816 : 而言並不是一個很好的策略,在還沒出場前又出現的 05/21 14:39
33F:→ sky22485816 : 訊號在統計上收益會更好,所以等於說必須要一直不 05/21 14:39
34F:→ sky22485816 : 斷的留錢給後面的訊號,不然勝率會比較低並且波動 05/21 14:39
35F:→ sky22485816 : 會比較大。 05/21 14:39