作者jaids (j-aids)
看板DataScience
标题[问题] 实用上CNN怎麽解决不同影像大小问题
时间Wed May 30 06:08:42 2018
网路上有些别人写好的网站,可以上传图片就即时帮你用神经网路做出处理後的成果
譬如Waifu2x等
但是他们通常没有规定死输入影像的长宽pixels
自己做作业是都要固定输入影像大小如512*512
才能吐output
因为convolution NN就是按input影像大小去写死filter size跟padding的
请问实用上CNN是怎麽解决input影像大小可能不固定的问题呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.137.25.187
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1527631724.A.A2B.html
1F:推 qwerty9876c: spatial pyramid pooling或global average pooling 05/30 07:23
2F:→ qwerty9876c: 可以参考看看 05/30 07:23
3F:→ Mchord: 不想resize input的话就不要用inner product 05/30 07:37
4F:→ yougigun: 推一楼 05/30 08:51
5F:推 germun: 通常就直接resize 看是bicubic还是内插什麽的就看人 05/30 20:49
6F:推 lunashining: resize不会把一些小特徵消掉吗?有些像病徵 瑕疵不是 05/30 23:06
7F:→ lunashining: 都才几个pixel 05/30 23:07
8F:推 sma1033: 建议直接去看R-CNN, Yolo or SSD这种物件追踪的相关Paper 05/31 01:48
9F:→ sma1033: 你提的这个问题,没有很简单效能又好的方法 05/31 01:49
10F:→ sma1033: 影像的物件侦测也算是一个特殊独门技术,并不是很容易 05/31 01:50
11F:→ sma1033: 同时要考虑到影像的变形以及大小问题,本来就是不容易啊 05/31 01:52
12F:推 NMOSFET: 训练的时候每个epoch随机改变输入图片的大小,参考YOLOV2 06/03 19:45
13F:推 uloyoy: 1楼的那个比较接近要撷取不同大小范围的特徵吧? 06/07 15:30
14F:推 HEroKuma: 限制大小是因为最後有full connect才要限制吧 06/10 08:48
15F:→ HEroKuma: 如果你的网路是FCN就没问题啦 06/10 08:49