作者kero961240 (kobe)
看板Statistics
標題[問題] 多個模型比較問題
時間Fri Nov 2 21:20:33 2018
想請問各位大大,目前小弟在工作上用了一個二分類模型
預測率來到 90%,但老闆不太滿意,問說假如要99% 怎麼辦
小弟提出一個想法,目前有三個差不多的模型
分別為SVM 深度學習 隨機森林 都有接近 90% 的準確
我倒入一組新的樣本(假設未知標籤),讓三個去辨別,
選擇三個模型中最多人判別的結果,再把另一個當作判別錯誤
丟進去那個模型的 train data,重新訓練模型,請問這樣是可行的嗎
會造成什麼問題嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.172.92.239
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1541164835.A.7A9.html
※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:21:28
1F:→ celestialgod: 試過ensamble沒? 11/02 21:53
c大學長您好,由於在校沒學過您說的,目前沒試過。
※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:58:08
※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:58:22
※ 編輯: kero961240 (1.172.92.239), 11/02/2018 21:58:49
※ 編輯: kero961240 (1.172.92.239), 11/02/2018 22:07:50
2F:→ andrew43: 我覺得應該先研究一下在各模型中誤判的樣本有何特徵 11/02 22:21
3F:推 statexpert: Feature多嗎?多的話可能會遇到curse of dimensionali 11/03 21:09
4F:→ statexpert: ty, 這時ensemble會是可能有效解法(同意樓上建議) 11/03 21:09
大大您好,我只能說維度超多,我們根本沒縮減
※ 編輯: kero961240 (1.172.112.140), 11/03/2018 22:53:06
5F:推 statexpert: 那就ensemble試看看, 11/04 02:54