作者jaids (j-aids)
看板DataScience
標題[問題] 實用上CNN怎麼解決不同影像大小問題
時間Wed May 30 06:08:42 2018
網路上有些別人寫好的網站,可以上傳圖片就即時幫你用神經網路做出處理後的成果
譬如Waifu2x等
但是他們通常沒有規定死輸入影像的長寬pixels
自己做作業是都要固定輸入影像大小如512*512
才能吐output
因為convolution NN就是按input影像大小去寫死filter size跟padding的
請問實用上CNN是怎麼解決input影像大小可能不固定的問題呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.25.187
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1527631724.A.A2B.html
1F:推 qwerty9876c: spatial pyramid pooling或global average pooling 05/30 07:23
2F:→ qwerty9876c: 可以參考看看 05/30 07:23
3F:→ Mchord: 不想resize input的話就不要用inner product 05/30 07:37
4F:→ yougigun: 推一樓 05/30 08:51
5F:推 germun: 通常就直接resize 看是bicubic還是內插什麼的就看人 05/30 20:49
6F:推 lunashining: resize不會把一些小特徵消掉嗎?有些像病徵 瑕疵不是 05/30 23:06
7F:→ lunashining: 都才幾個pixel 05/30 23:07
8F:推 sma1033: 建議直接去看R-CNN, Yolo or SSD這種物件追蹤的相關Paper 05/31 01:48
9F:→ sma1033: 你提的這個問題,沒有很簡單效能又好的方法 05/31 01:49
10F:→ sma1033: 影像的物件偵測也算是一個特殊獨門技術,並不是很容易 05/31 01:50
11F:→ sma1033: 同時要考慮到影像的變形以及大小問題,本來就是不容易啊 05/31 01:52
12F:推 NMOSFET: 訓練的時候每個epoch隨機改變輸入圖片的大小,參考YOLOV2 06/03 19:45
13F:推 uloyoy: 1樓的那個比較接近要擷取不同大小範圍的特徵吧? 06/07 15:30
14F:推 HEroKuma: 限制大小是因為最後有full connect才要限制吧 06/10 08:48
15F:→ HEroKuma: 如果你的網路是FCN就沒問題啦 06/10 08:49