作者tank123zzz (哇呼呼)
看板DataScience
标题[问题] 关於使用Keras处理不均匀测资
时间Thu Oct 25 22:41:40 2018
非常抱歉
小弟的作业找不到解决方法
上来询问
如果违反版规我会自删
------------------------------------------------
要从17000笔资料
每笔都有17个特徵
学习怎麽推出三种分类
由於结果比例约为60:1:1
不管我怎麽跑出来的结果
都是60的那个部分
我用的方法是使用keras跑RNN
hiden layer的activiation都是relu
loss是mse
potimizer是adam
目前想到是增加layer以及他的unit
但是这个要跑好久
所以先上来问问看这个方法是不是正确的
(抱歉我刚学 很菜 连作业都要上来问 非常抱歉)
-----
Sent from JPTT on my Sony G3426.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.238.141.239
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1540478503.A.332.html
1F:推 EGsux: 为啥要用RNN 你的东西LR也做的到吧,然後方向错了,data 10/26 00:01
2F:→ EGsux: 要再处理 10/26 00:01
3F:推 AgileSeptor: 基本招就是训练时,硬把每个batch三类比例调成平衡 10/26 00:26
4F:推 zxp9505007: 不会调整batch 就复制负样本 让他们比例一样 10/26 08:01
5F:推 bruce3557: 可以看看要不要调整class weight 10/26 16:53
6F:推 gbd37: 样本比例要调整 不然任何算法都无解不均匀资料 10/27 08:40
7F:推 ZuiYang: 特徵都定义好了...考虑SVM直接分吗? 10/27 19:19
8F:推 chchan1111: GOOGLE 'smote' 简单一点就直接复制 10/29 01:00
9F:→ chchan1111: 虽然多样性不会变 但至少能解决资料不平衡 10/29 01:01
10F:→ chchan1111: 其实增加资料量的方法很多 加高斯噪音 GAN SMOTE 10/29 01:02
11F:→ chchan1111: 图片的话还可以加一些模糊 锐利度之类的 自己玩看看 10/29 01:02
12F:推 lunashining: 楼上说的SMOTE是什麽? 其实好像一直没有paper提到如 10/29 22:43
13F:→ lunashining: 果DA资料增加到几倍或多少准确率就不会上升了 10/29 22:44
14F:推 Linlosehow: Smote我试过的case都蛮雷的 不推 10/31 14:39
15F:→ Linlosehow: 你先试Under sampling解这问题 其他再说 10/31 14:42