作者oe725 ( )
看板DataScience
标题[问题] object detect(YOLO)相关问题
时间Thu Jan 10 23:27:07 2019
各位大大好, 最近在研究用YOLOv3处理影像辨识问题
假如我要辨识小物件, 例如:蜜蜂
但是我的traing data严重缺乏, 可能只有数十张, 但是其中有些图片中可能同时出现数
十只蜜蜂
我的问题如下 :
1. 在帮training data做label时, 假使一张图中有50只蜜蜂
1.1 同一张图, 一次标50个label
1.2 分做50张, 一次标1个label
1.3 分做10张, 一次标5个label
请问上列三种方法, 对训练结果/收敛速度会有影响吗?
P.S. 我自己测试的结果是, 每张图都有数只到数十只蜜蜂, 我只标其中的数个(没有
全标)当用training data下去test时, 只会标出我当初有label的那几只
但是期望值是其他只也能辨识出来, 所以我才想说是不是要全标?
2. 当training dtata不足时, 需要再放一些负面data吗?也就是增加一些没有labeled的
图片如果需要, 正负data间的比例抓多少比较好?
3. YOLOv3吃的image size是320x320 ~ 608x608, 所以会先对input data做resize
假如我的影像都是1080P的图片, 而且待辨识物件都是小物件, resize完是不是更难
extract feature
所以如果怕失真太严重, 在丢给YOLO前先做几层CONV, 透过kernel map压缩到YOLO可
以吃的大小, 这样是不是比直接resize好? (观念有错请指正, 谢谢)
感谢赐教
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 123.193.176.75
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1547134029.A.D81.html
1F:→ jackwang01: 可能overfit 有点严重,多一些训练资料比较好,再来这 01/10 23:49
2F:→ jackwang01: 种问题我是没看过有人放负面资料的?毕竟这是object d 01/10 23:49
3F:→ jackwang01: etection不是classification 01/10 23:49
4F:→ jackwang01: 比较建议一张照片里面能标的尽量标,然後张数越多越好 01/10 23:51
5F:→ jackwang01: ,再来就是测试的时候用测试资料来看而不是用训练资 01/10 23:51
6F:→ jackwang01: 料 01/10 23:51
7F:→ oe725: 想说先用training data确认一下有无underfiting 01/11 00:51
8F:推 kokolotl: 请问这种状况适合把大张图切成小张图来做吗 01/11 07:49
9F:推 kyushu: 以yolo来说,non-object 就是negative了 01/11 19:25
10F:推 kyushu: 你用yolo3,基本上小物件的准确率会比较好,trainging跟in 01/11 19:29
11F:→ kyushu: ference用608或544的size对小物件也会有所提升 01/11 19:29
12F:→ truehero: 全标, random crop ,总数千只蜜蜂辨识率应该不会太低 01/12 20:40
13F:推 lunashining: 借问是不是只有mask_rcnn 不适合切小张图,其他的OD 01/14 09:33
14F:→ lunashining: 都比较适合切小张 好比人脸只切脸之类的 01/14 09:33
15F:→ oe725: 针对问题1有大能有建议吗?谢谢 01/14 22:19
16F:→ followwar: 上面有人说阿 全标+random crop 01/15 01:03
17F:→ oe725: 我是比较想了解training时,一张大图跟切成数张小图有无差异 01/15 21:15
18F:推 lunashining: 如果物体很小 random crop刚好只切到一小部分去train 01/16 09:56
19F:→ lunashining: 不会有问题吗? 01/16 09:57
20F:→ truehero: 半只蜜蜂还是蜜蜂阿 01/18 23:45
21F:→ Mchord: 根据ssd的random crop规则,每个被切到的东西都不能被切 01/24 07:36
22F:→ Mchord: 掉太多,否则不采用,再重新切过。 01/24 07:36