作者oe725 ( )
看板DataScience
標題[問題] object detect(YOLO)相關問題
時間Thu Jan 10 23:27:07 2019
各位大大好, 最近在研究用YOLOv3處理影像辨識問題
假如我要辨識小物件, 例如:蜜蜂
但是我的traing data嚴重缺乏, 可能只有數十張, 但是其中有些圖片中可能同時出現數
十隻蜜蜂
我的問題如下 :
1. 在幫training data做label時, 假使一張圖中有50隻蜜蜂
1.1 同一張圖, 一次標50個label
1.2 分做50張, 一次標1個label
1.3 分做10張, 一次標5個label
請問上列三種方法, 對訓練結果/收斂速度會有影響嗎?
P.S. 我自己測試的結果是, 每張圖都有數隻到數十隻蜜蜂, 我只標其中的數個(沒有
全標)當用training data下去test時, 只會標出我當初有label的那幾隻
但是期望值是其他隻也能辨識出來, 所以我才想說是不是要全標?
2. 當training dtata不足時, 需要再放一些負面data嗎?也就是增加一些沒有labeled的
圖片如果需要, 正負data間的比例抓多少比較好?
3. YOLOv3吃的image size是320x320 ~ 608x608, 所以會先對input data做resize
假如我的影像都是1080P的圖片, 而且待辨識物件都是小物件, resize完是不是更難
extract feature
所以如果怕失真太嚴重, 在丟給YOLO前先做幾層CONV, 透過kernel map壓縮到YOLO可
以吃的大小, 這樣是不是比直接resize好? (觀念有錯請指正, 謝謝)
感謝賜教
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.193.176.75
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1547134029.A.D81.html
1F:→ jackwang01: 可能overfit 有點嚴重,多一些訓練資料比較好,再來這 01/10 23:49
2F:→ jackwang01: 種問題我是沒看過有人放負面資料的?畢竟這是object d 01/10 23:49
3F:→ jackwang01: etection不是classification 01/10 23:49
4F:→ jackwang01: 比較建議一張照片裡面能標的盡量標,然後張數越多越好 01/10 23:51
5F:→ jackwang01: ,再來就是測試的時候用測試資料來看而不是用訓練資 01/10 23:51
6F:→ jackwang01: 料 01/10 23:51
7F:→ oe725: 想說先用training data確認一下有無underfiting 01/11 00:51
8F:推 kokolotl: 請問這種狀況適合把大張圖切成小張圖來做嗎 01/11 07:49
9F:推 kyushu: 以yolo來說,non-object 就是negative了 01/11 19:25
10F:推 kyushu: 你用yolo3,基本上小物件的準確率會比較好,trainging跟in 01/11 19:29
11F:→ kyushu: ference用608或544的size對小物件也會有所提升 01/11 19:29
12F:→ truehero: 全標, random crop ,總數千隻蜜蜂辨識率應該不會太低 01/12 20:40
13F:推 lunashining: 借問是不是只有mask_rcnn 不適合切小張圖,其他的OD 01/14 09:33
14F:→ lunashining: 都比較適合切小張 好比人臉只切臉之類的 01/14 09:33
15F:→ oe725: 針對問題1有大能有建議嗎?謝謝 01/14 22:19
16F:→ followwar: 上面有人說阿 全標+random crop 01/15 01:03
17F:→ oe725: 我是比較想了解training時,一張大圖跟切成數張小圖有無差異 01/15 21:15
18F:推 lunashining: 如果物體很小 random crop剛好只切到一小部分去train 01/16 09:56
19F:→ lunashining: 不會有問題嗎? 01/16 09:57
20F:→ truehero: 半隻蜜蜂還是蜜蜂阿 01/18 23:45
21F:→ Mchord: 根據ssd的random crop規則,每個被切到的東西都不能被切 01/24 07:36
22F:→ Mchord: 掉太多,否則不採用,再重新切過。 01/24 07:36