DataScience 板


LINE

作業系統: win10 問題類別: DL, 遷移式學習 使用工具: python, pytorch 問題內容: 各位好,小弟正在使用pytorch訓練一個分類模型 這個分類問題的難題在於不是所有類別都會在同一個數據集出現 數據集A可能出現類別1~5 數據集B可能只會出現類別4-7 因此為了可以學習到所有的類別,決定採用遷移式學習的方式 先在數據集A上訓練模型 讓模型可以很好的分辨類別1~5 接著將保存好的模型引入數據集B中進行訓練 過程中兩邊的模型設定都保持一致 而輸出的類別數目都是保持總數目 以例子來看的話就是都分類為7個類別 然而在數據集B訓練一陣子之後 拿保存的模型去預測數據集A 發現效果變的非常差 好像原本在數據集A上學習的參數在訓練過程中已經被洗掉了一樣 想請教為什麼會導致這樣的現象呢? 在遷移學習的過程中,模型的引入有什麼需要特別注意的地方嗎 或是有什麼方式可以較好的解決此類問題嗎? 並不考慮合併數據集,因為數據集非常的龐大,實際類別也不只7類 所以想先從遷移式學習的方向上著手 感謝Data Science版的各位大大 --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.226.153 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1581004497.A.8F6.html ※ 編輯: karco (140.113.226.153 臺灣), 02/07/2020 00:00:28
1F:→ youngman77: https://openreview.net/forum?id=Skgxcn4YDS 02/07 00:16
感謝大大,明天會找時間好好閱讀
2F:→ chang1248w: 就是被洗掉了不用懷疑 02/07 00:43
那有沒有方法可以避免被洗掉呢? ※ 編輯: karco (140.113.226.153 臺灣), 02/07/2020 00:44:44
3F:→ chang1248w: 要嘛就打散一起學,不然就切成三個分辨器,先分AB再 02/07 00:45
4F:→ chang1248w: 分細項 02/07 00:45
5F:→ chang1248w: 數據集夠大抽出一部分也會有足夠的代表性 02/07 00:50
6F:→ roccqqck: 原資料也一起學 02/07 01:25
7F:→ youngman77: Also, https://openreview.net/forum?id=HklUCCVKDB 02/07 11:27
8F:→ youngman77: continual learning, catastrophic forgetting 02/07 11:29
9F:→ youngman77: lifelong learning; these tags may help 02/07 11:30
10F:推 sxy67230: 基本上就是被洗掉了,你可以想像transfer learning就是 02/07 12:42
11F:→ sxy67230: 在既有有限的空間上去學習新的任務。如果新的任務學好了 02/07 12:42
12F:→ sxy67230: ,那就很容易遺忘掉舊有的內容。想要做到不會遺忘可以 02/07 12:43
13F:→ sxy67230: 考慮EWC、GEM、progressive network,比較新的研究還有D 02/07 12:43
14F:→ sxy67230: ynamically expandable network。或是直接拿舊有資料混 02/07 12:43
15F:→ sxy67230: 合去train、或是考慮到記憶體可以去train 一個generativ 02/07 12:43
16F:→ sxy67230: e model來生成舊資料再去train。如果任務不複雜,也可以 02/07 12:43
17F:→ sxy67230: 考慮把A、B task順序調換可能就有不錯的效果。 02/07 12:43
18F:→ yoyololicon: 合併啊 數據不是越多越好?還是合併會有啥問題 02/07 14:17
19F:→ chang1248w: 爆ram 02/07 17:19
20F:推 goldflower: 有可能B是會一直變的吧 比如一直增加的類別之類的 導 02/08 16:35
21F:→ goldflower: 致全部重新訓練很沒有效率 02/08 16:35
22F:推 goldflower: 另外一個方法 找Out of Distribution Detection的相 02/08 16:47
23F:→ goldflower: 關技術 分兩段訓練 02/08 16:47
24F:→ goldflower: 不過如果類別真的會一直長 這招可能也是治標不治本XD 02/08 16:48
25F:→ yoyololicon: 爆ram就checkpoints 設起來R 02/09 20:10
26F:→ yoyololicon: batch太大就gradient accumulate起來 很多招可以用 02/09 20:12
27F:→ yoyololicon: ㄉ 02/09 20:12
28F:→ hippo130: 雪崩式的忘記 02/14 00:56
29F:→ catxfish: 在訓練樣本的抽樣上多下功夫比較實際吧 02/14 00:56
30F:→ catxfish: 一般分類器用不平衡的訓練樣本怎麼可能會有好效果呢 02/14 01:01
31F:推 andy5656: 這就Continual Learning 的範疇 02/14 11:34







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:BabyMother站內搜尋

TOP