作者kero961240 (kobe)
看板Statistics
标题[问题] 多个模型比较问题
时间Fri Nov 2 21:20:33 2018
想请问各位大大,目前小弟在工作上用了一个二分类模型
预测率来到 90%,但老板不太满意,问说假如要99% 怎麽办
小弟提出一个想法,目前有三个差不多的模型
分别为SVM 深度学习 随机森林 都有接近 90% 的准确
我倒入一组新的样本(假设未知标签),让三个去辨别,
选择三个模型中最多人判别的结果,再把另一个当作判别错误
丢进去那个模型的 train data,重新训练模型,请问这样是可行的吗
会造成什麽问题吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.172.92.239
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1541164835.A.7A9.html
※ 编辑: kero961240 (1.172.92.239), 11/02/2018 21:21:28
1F:→ celestialgod: 试过ensamble没? 11/02 21:53
c大学长您好,由於在校没学过您说的,目前没试过。
※ 编辑: kero961240 (1.172.92.239), 11/02/2018 21:58:08
※ 编辑: kero961240 (1.172.92.239), 11/02/2018 21:58:22
※ 编辑: kero961240 (1.172.92.239), 11/02/2018 21:58:49
※ 编辑: kero961240 (1.172.92.239), 11/02/2018 22:07:50
2F:→ andrew43: 我觉得应该先研究一下在各模型中误判的样本有何特徵 11/02 22:21
3F:推 statexpert: Feature多吗?多的话可能会遇到curse of dimensionali 11/03 21:09
4F:→ statexpert: ty, 这时ensemble会是可能有效解法(同意楼上建议) 11/03 21:09
大大您好,我只能说维度超多,我们根本没缩减
※ 编辑: kero961240 (1.172.112.140), 11/03/2018 22:53:06
5F:推 statexpert: 那就ensemble试看看, 11/04 02:54