作者Xuan3716 (蛋)
看板DataScience
标题[问题] 该如何在CNN使用unlabeled data?
时间Mon Dec 20 22:22:18 2021
作业系统:Win10
问题类别:CNN
使用工具:python
问题内容:
各位版友好,小弟是深度学习的新手,目前正在学习如何使用CNN辨识图片中的衣物是哪种款式,
现在使用tensorflow.keras 模型为VGG16,单纯只使用train data的准确率只有0.76,这个
成绩非常不理想,虽然有额外的unlabeled data,约为5000张的图片,但是不知道怎麽从co
de下手,实际运用在程式里。所以想请教各位前辈,指点一下小弟,谢谢。
----
Sent from
BePTT on my iPhone 12
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 42.72.82.180 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1640010140.A.935.html
※ 编辑: Xuan3716 (140.112.38.189 台湾), 12/20/2021 22:34:03
1F:推 jigfopsda: 建议先换 efficientnet 或 nfnet 或其他最近的 model 12/20 22:33
2F:推 yoyololicon: 你想做semi-supervised,unsupervised learning? 12/20 22:35
3F:→ Xuan3716: 目前只用到知道答案的train data,我想做semi-surpervis 12/20 22:48
4F:→ Xuan3716: ed learning。 12/20 22:48
5F:→ Xuan3716: 如果想再增加7%的准确率,只能换一个model了吗?谢谢各 12/20 22:49
6F:→ Xuan3716: 位前辈。 12/20 22:49
7F:→ jigfopsda: 可能有其他方法,不过换 model 最快吧!我看 keras 也 12/20 23:00
8F:→ jigfopsda: 有内建 efficientnet 12/20 23:01
10F:→ chang1248w: 你原本的资料集多大? 12/21 01:40
11F:→ chang1248w: 有做 argumentation? 12/21 01:41
12F:→ chang1248w: 最简单的方法是用预训练的模型帮所有资料编码,再用k 12/21 01:47
13F:→ chang1248w: nn之类的算法以标签过的数据帮没有标签过的数据上标 12/21 01:47
14F:→ chang1248w: 签,最後用这些标签训练模型 12/21 01:47
15F:→ chang1248w: 近期一点的可以先用所有资料做语义的自回归模型,再 12/21 01:49
16F:→ chang1248w: 用标签训练任务模型 12/21 01:49
17F:→ Xuan3716: Train data有9279笔,test data 有2800笔,unlabeled 12/21 12:07
18F:→ Xuan3716: data有5277笔。 12/21 12:07
19F:→ chang1248w: 不无小补 12/22 05:55
20F:→ Xuan3716: 谢谢各位前辈! 12/22 19:22
21F:推 TuCH: 才5000张 我的建议是直接label 01/01 23:26
22F:→ TuCH: 1张5秒 25000秒 约8小时 01/01 23:27