作者rain45 (润)
看板DataScience
标题[问题] yolov3观念请益
时间Sun Apr 19 22:23:54 2020
各位大大好,小弟最近在读CNN和yolov3
在看完论文後,有一些观念不太确定对不对
想请版友纠正:
1.训练时我们其实在训练的是每一层的卷积核,也就是所谓的filter(kernel),让卷积网
路在实际应用时,可以透过这些核得到最大的响应(乘积),请问这样理解对吗?
2.在「训练」时,物件中心(GT中心)的网格负责预测,而网路学习预测bounding box的
偏移量。根据论文可知v3会在三个尺度上做预测,我想请问的是,在「预测未知的图片」
,也就是不是训练期的时候,是透过darknet-53这个feature extractor卷积後,在三个
尺度(8*8、16*16、32*32)的「每一个网格」直接输出它所预测的偏移量、置信度、类
别机率吗?
抱歉第二个问题有点长,主要是想厘清「训练」跟「推论」阶段的一些程序,希望可以为
小弟解答,谢谢各位!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 123.194.189.232 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1587306236.A.79E.html
1F:→ jackwang01: 1、2都是,没错 04/20 00:20
2F:→ rain45: 了解 谢谢您! 04/20 18:58