作者andy086 (狐狸)
看板DataScience
标题[问题] Yolo问题询问
时间Mon Jun 8 13:49:02 2020
板上的各位好,想询问几个与Yolo相关的问题
目前手上的图档大小约为60000*60000的超大图
而在做标记的时候也是直接针对整张超大图做标记
但在训练时不太可能直接将整张图丢进去train
1. 所以想问第一个问题
假设我将图档切成一张一张1024*1024的小图,那label的部分该怎麽处理?
例如下图:在切小图的时候并无法涵盖到整个label的区域
所以以图1来说label的部分就会变成是整个右下角,图2则为整个左下角对吗?
https://i.imgur.com/KrfEslQ.png
2. 第二个问题
当我在切小图时并不会所有的小图都有标记的区域
所以这样在存annotation的xml档时,是不是该张图就不需要对应的xml档?
还是也需要只是边界的部分都填0之类的?
不好意思,再麻烦板上的高手帮忙解答了!谢谢
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 163.14.191.156 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1591595345.A.EEC.html
1F:→ magic83v: 对图片resize呢? 标出box的部分再放大回原图 06/08 19:10
这方法目前应该不考虑,因为图片数量也才300张左右,resize会让资料量不足
且容易失焦?
2F:→ CaptPlanet: 第一个问题 你的想法没错 要注意的是分割前处理流程要 06/09 17:41
3F:→ CaptPlanet: 固定好 这样就把问题转换成训练一个对子图侦测的模型 06/09 17:41
4F:→ CaptPlanet: 第二个问题 切小图可能会产生大量 negative data 需要 06/09 17:44
5F:→ CaptPlanet: 注意 negative 跟 positive samples 的比例 (资料平 06/09 17:44
6F:→ CaptPlanet: 衡的问题)若像 SSD 这种的就有 hard negative mining 06/09 17:44
7F:→ CaptPlanet: 机制 比例是1:3就不用放没目标物的图片 可以参考看 06/09 17:44
8F:→ CaptPlanet: 看 06/09 17:44
了解,谢谢C大说明,确实没想到会造成比例偏差的问题
那请问没有目标物的图片也会需要相对应的xml档吗?
※ 编辑: andy086 (163.14.43.88 台湾), 06/09/2020 18:05:22