作者tank123zzz (哇呼呼)
看板DataScience
標題[問題] 關於使用Keras處理不均勻測資
時間Thu Oct 25 22:41:40 2018
非常抱歉
小弟的作業找不到解決方法
上來詢問
如果違反版規我會自刪
------------------------------------------------
要從17000筆資料
每筆都有17個特徵
學習怎麼推出三種分類
由於結果比例約為60:1:1
不管我怎麼跑出來的結果
都是60的那個部分
我用的方法是使用keras跑RNN
hiden layer的activiation都是relu
loss是mse
potimizer是adam
目前想到是增加layer以及他的unit
但是這個要跑好久
所以先上來問問看這個方法是不是正確的
(抱歉我剛學 很菜 連作業都要上來問 非常抱歉)
-----
Sent from JPTT on my Sony G3426.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.238.141.239
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1540478503.A.332.html
1F:推 EGsux: 為啥要用RNN 你的東西LR也做的到吧,然後方向錯了,data 10/26 00:01
2F:→ EGsux: 要再處理 10/26 00:01
3F:推 AgileSeptor: 基本招就是訓練時,硬把每個batch三類比例調成平衡 10/26 00:26
4F:推 zxp9505007: 不會調整batch 就複製負樣本 讓他們比例一樣 10/26 08:01
5F:推 bruce3557: 可以看看要不要調整class weight 10/26 16:53
6F:推 gbd37: 樣本比例要調整 不然任何算法都無解不均勻資料 10/27 08:40
7F:推 ZuiYang: 特徵都定義好了...考慮SVM直接分嗎? 10/27 19:19
8F:推 chchan1111: GOOGLE 'smote' 簡單一點就直接複製 10/29 01:00
9F:→ chchan1111: 雖然多樣性不會變 但至少能解決資料不平衡 10/29 01:01
10F:→ chchan1111: 其實增加資料量的方法很多 加高斯噪音 GAN SMOTE 10/29 01:02
11F:→ chchan1111: 圖片的話還可以加一些模糊 銳利度之類的 自己玩看看 10/29 01:02
12F:推 lunashining: 樓上說的SMOTE是什麼? 其實好像一直沒有paper提到如 10/29 22:43
13F:→ lunashining: 果DA資料增加到幾倍或多少準確率就不會上升了 10/29 22:44
14F:推 Linlosehow: Smote我試過的case都蠻雷的 不推 10/31 14:39
15F:→ Linlosehow: 你先試Under sampling解這問題 其他再說 10/31 14:42