作者s1010257 (波)
看板DataScience
标题[问题] 验证集资料评估
时间Sun Jun 21 20:35:01 2020
问题类别:CNN
使用工具:tensorflow,keras
问题内容:
最近在用CNN来判断如下图所示(示意图)
如果红圈压到蓝色区块则辨识为NG,
反之则正常
https://i.imgur.com/M9xOoAi.jpg
分类输出就两类,一个NG,另一个OK
原始资料集图片数量NG 30张,ok 10张
我透过图像扩增的方式将图片增加到6万张(两类数量各半)
然後拆分80%训练集 10%验证集 10%验证集
CNN架构以下面acc及loss数据表
我只有搭一层卷积(filter=64)和池化层
接一个隐藏层(60个神经元)和输出(2个)
在输出成前面有加个BN层做正规化
跑出来的结果可以看到训练集资料都蛮稳定成长
但验证集的成长幅度很不稳定
https://i.imgur.com/NtU94Ui.jpg
之前也有尝试使用VGG16之类的模型结构
也有自己尝试搭2~3层的卷积层
可是效果也不太理想
去请教别别人是说可能模型太深
所以这次我用一层的卷积及池化作尝试
但感觉还是不太理想
想请问大家遇到这种情况可能的原因是什麽?
好让我有个方向尝试改善,
最近种感觉就单纯随便在try参数及模型架构
但结果都很不理想,很茫然QAQ
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.165.106.190 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1592742903.A.B2E.html
1F:推 email81227: 图片那个有可能是模型太浅?请问後面是怎个不理想呢? 06/21 21:48
2F:推 andy086: 你的图片颜色都长一样吗?这样用NN模型应该很难train吧, 06/21 22:26
3F:→ andy086: cnn跑完的特徵矩阵会太过接近,这种感觉可以用opencv处理 06/21 22:26
4F:→ andy086: 看看 06/21 22:26
5F:→ andy086: 用色阶方式处理在判断图形之类的 06/21 22:27
6F:→ andy086: 验证会这麽动荡感觉就是模型自己也不是很确定所以两边在 06/21 22:29
7F:→ andy086: 猜,要马就猜对很高不然就一起猜错 06/21 22:29
8F:→ s1010257: 目前不确定是不是模型太浅的关系,之前有试过比较深的cn 06/21 23:04
9F:→ s1010257: n,但结果训练集很快就收敛,最後测试集的混淆矩阵可以 06/21 23:04
10F:→ s1010257: 看到没有像训练集的准确一样高,结果就像下面这张图 06/21 23:04
12F:→ s1010257: 有可能喔,图像扩增其实图片背景颜色都差不多,我再尝 06/21 23:08
13F:→ s1010257: 试做一点其他颜色的图片来训练,谢谢你的建议,我再来 06/21 23:08
14F:→ s1010257: 尝试看看 06/21 23:08
15F:→ s1010257: opencv影像处理这类的问题我想应该没问题,但这个研究 06/21 23:11
16F:→ s1010257: 的内容得用AI的元素QAQ 06/21 23:11
17F:→ chang1248w: 为啥输出是二维? 06/22 01:23
18F:→ chang1248w: 输出一维然後loss用BCE试试 06/22 01:26
19F:→ chang1248w: 没事 06/22 01:27
20F:推 sxy67230: 很有可能最後的flattern出来的特徵太过相似,其实你的 06/22 19:19
21F:→ sxy67230: 模型根本没学到真正细部的特徵,用opencv同阶色化 crop 06/22 19:19
22F:→ sxy67230: 到你想要的部份在去train,或是直接转换任务为相似度比 06/22 19:19
23F:→ sxy67230: 对问题,在去做训练。 06/22 19:19
24F:→ s1010257: 用2D的卷积层,输出张量是3D的应该没错(高、宽、channe 06/22 21:17
25F:→ s1010257: l) 06/22 21:17
26F:→ s1010257: 好,谢谢您的建议,我先去了解一下关於您的建议再去做 06/22 21:22
27F:→ s1010257: 尝试,谢谢 06/22 21:22
28F:推 Sfly: 我觉得你需要来个1x1 conv 06/24 16:23
29F:→ s1010257: 好,会尝试看看 谢谢你! 06/24 23:59
30F:推 email81227: 我注意到你给的图片上loss不是binary_crossentropy 06/25 19:52
31F:→ email81227: 有用过binary的试试看吗? 06/25 19:53
32F:→ s1010257: 最ㄧ开始我也有用过binary後来才改用categorical状况好 06/26 01:26
33F:→ s1010257: 像也没改善,之後再测测看 06/26 01:26
34F:→ p193202: 机械手臂摆放晶圆 wafer 的异常偏移侦测? 06/29 14:00
35F:推 qwe84518: 把BN拿掉看看 06/30 16:19
36F:→ s1010257: p大 不是,是类似判断孔洞钻孔是否正常的瑕疵检测 06/30 21:29
37F:→ s1010257: q大 有试着拿掉看看,但如果网路太深发现训练结果都会 06/30 21:33
38F:→ s1010257: 集中在pass,也有试过比较浅的,只是准确率也差不多在50 06/30 21:33
39F:→ s1010257: 左右,目前在尝试研究透过opencv对图像做些处理再进行训 06/30 21:33
40F:→ s1010257: 练,之前都是丢原图直接下去做模型训练 06/30 21:33