[問題] 遷移學習如何不破壞在原問題上學習的成果

時間Thu Feb 6 23:54:55 2020

作業系統: win10 問題類別: DL, 遷移式學習使用工具: python, pytorch 問題內容: 各位好，小弟正在使用pytorch訓練一個分類模型這個分類問題的難題在於不是所有類別都會在同一個數據集出現數據集A可能出現類別1~5 數據集B可能只會出現類別4-7 因此為了可以學習到所有的類別，決定採用遷移式學習的方式先在數據集A上訓練模型讓模型可以很好的分辨類別1~5 接著將保存好的模型引入數據集B中進行訓練過程中兩邊的模型設定都保持一致而輸出的類別數目都是保持總數目以例子來看的話就是都分類為7個類別然而在數據集B訓練一陣子之後拿保存的模型去預測數據集A 發現效果變的非常差好像原本在數據集A上學習的參數在訓練過程中已經被洗掉了一樣想請教為什麼會導致這樣的現象呢? 在遷移學習的過程中，模型的引入有什麼需要特別注意的地方嗎或是有什麼方式可以較好的解決此類問題嗎? 並不考慮合併數據集，因為數據集非常的龐大，實際類別也不只7類所以想先從遷移式學習的方向上著手感謝Data Science版的各位大大 --

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.226.153 (臺灣) ※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1581004497.A.8F6.html ※ 編輯: karco (140.113.226.153 臺灣), 02/07/2020 00:00:28

1^F：→ youngman77: https://openreview.net/forum?id=Skgxcn4YDS 02/07 00:16

感謝大大，明天會找時間好好閱讀

2^F：→ chang1248w: 就是被洗掉了不用懷疑 02/07 00:43

那有沒有方法可以避免被洗掉呢? ※ 編輯: karco (140.113.226.153 臺灣), 02/07/2020 00:44:44

3^F：→ chang1248w: 要嘛就打散一起學，不然就切成三個分辨器，先分AB再 02/07 00:45

4^F：→ chang1248w: 分細項 02/07 00:45

5^F：→ chang1248w: 數據集夠大抽出一部分也會有足夠的代表性 02/07 00:50

6^F：→ roccqqck: 原資料也一起學 02/07 01:25

7^F：→ youngman77: Also, https://openreview.net/forum?id=HklUCCVKDB 02/07 11:27

8^F：→ youngman77: continual learning, catastrophic forgetting 02/07 11:29

9^F：→ youngman77: lifelong learning; these tags may help 02/07 11:30

10^F：推 sxy67230: 基本上就是被洗掉了，你可以想像transfer learning就是 02/07 12:42

11^F：→ sxy67230: 在既有有限的空間上去學習新的任務。如果新的任務學好了 02/07 12:42

12^F：→ sxy67230: ，那就很容易遺忘掉舊有的內容。想要做到不會遺忘可以 02/07 12:43

13^F：→ sxy67230: 考慮EWC、GEM、progressive network，比較新的研究還有D 02/07 12:43

14^F：→ sxy67230: ynamically expandable network。或是直接拿舊有資料混 02/07 12:43

15^F：→ sxy67230: 合去train、或是考慮到記憶體可以去train 一個generativ 02/07 12:43

16^F：→ sxy67230: e model來生成舊資料再去train。如果任務不複雜，也可以 02/07 12:43

17^F：→ sxy67230: 考慮把A、B task順序調換可能就有不錯的效果。 02/07 12:43

18^F：→ yoyololicon: 合併啊數據不是越多越好？還是合併會有啥問題 02/07 14:17

19^F：→ chang1248w: 爆ram 02/07 17:19

20^F：推 goldflower: 有可能B是會一直變的吧比如一直增加的類別之類的導 02/08 16:35

21^F：→ goldflower: 致全部重新訓練很沒有效率 02/08 16:35

22^F：推 goldflower: 另外一個方法找Out of Distribution Detection的相 02/08 16:47

23^F：→ goldflower: 關技術分兩段訓練 02/08 16:47

24^F：→ goldflower: 不過如果類別真的會一直長這招可能也是治標不治本XD 02/08 16:48

25^F：→ yoyololicon: 爆ram就checkpoints 設起來R 02/09 20:10

26^F：→ yoyololicon: batch太大就gradient accumulate起來很多招可以用 02/09 20:12

27^F：→ yoyololicon: ㄉ 02/09 20:12

28^F：→ hippo130: 雪崩式的忘記 02/14 00:56

29^F：→ catxfish: 在訓練樣本的抽樣上多下功夫比較實際吧 02/14 00:56

30^F：→ catxfish: 一般分類器用不平衡的訓練樣本怎麼可能會有好效果呢 02/14 01:01

31^F：推 andy5656: 這就Continual Learning 的範疇 02/14 11:34

	[問題/行為] 貓晚上進房間會不會有憋尿問題
	Re: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一張
	[心得] EMS高領長版毛衣.墨小樓MC1002
	[分享] 丹龍隔熱紙GE55+33+22
	[問題] 清洗洗衣機
	[尋物] 窗台下的空間
	[閒聊] 双極の女神1 木魔爵
	[售車] 新竹 1997 march 1297cc 白色四門
	[討論] 能從照片感受到攝影者心情嗎
	[狂賀] 賀賀賀賀賀！島村卯月！總選舉NO.1
	[難過] 羨慕白皮膚的女生
	閱讀文章
	[黑特]
	[問題] SBK S1安裝於安全帽位置
	[分享] 舊woo100絕版開箱!!
	Re: [無言] 關於小包衛生紙
	[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
	[心得] 蒼の海賊龍地獄執行者16PT
	[售車] 1999年Virage iO 1.8EXi
	[心得] 挑戰33 LV10 獅子座pt solo
	[閒聊] 手把手教你不被桶之新手主購教學
	[分享] Civic Type R 量產版官方照無預警流出
	[售車] Golf 4 2.0 銀色自排
	[出售] Graco提籃汽座（有底座）2000元誠可議
	[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
	[問題] 44th 單曲生寫竟然都給重複的啊啊！
	[心得] 華南紅卡/icash 核卡
	[問題] 拔牙矯正這樣正常嗎
	[贈送] 老莫高業初業 102年版
	[情報] 三大行動支付本季掀戰火
	[寶寶] 博客來Amos水蠟筆5/1特價五折
	Re: [心得] 新鮮人一些面試分享
	[心得] 蒼の海賊龍地獄麒麟25PT
	Re: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
	Re: [閒聊] OGN中場影片：失蹤人口局 (英文字幕)
	[問題] 台灣大哥大4G訊號差
	[出售] [全國]全新千尋侘草LED燈, 水草

WEB批踢踢(PTT)

DataScience 板

[問題] 遷移學習如何不破壞在原問題上學習的成果

熱門看板

贊助商連結