作者s1010257 (波)
看板DataScience
標題[問題] conv3D
時間Fri Apr 3 04:18:55 2020
作業系統: win10
問題類別: Conv3D
使用工具: keras、tensorflow
問題內容:
最近在翻keras.io文件 看到conv input shape
目前練習的影像辨識圖片都是透過conv2D進行卷積
那如果透過3D攝影機擷取的影像多了縱深的維度是否透過conv3d進行卷積?
對於3d影像的維度其實不是很了解
想請問想法是否正確
或是有沒有一些透過3D影像分析的文章可供參考?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.235.118.45 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1585858737.A.C0E.html
1F:推 guestttttt: 一般影像是RGB三channel, 3d影像是RGBD四channel 04/03 13:13
2F:→ guestttttt: 只是多一個channel, 應該還是用conv2D 04/03 13:14
4F:推 zxp9505007: 3D通常是用來分析點雲圖或是CAD圖 而非影像 04/03 15:14
5F:→ s1010257: 好 謝謝你們的回覆 會在多去了解! 04/03 15:43
6F:推 kaltu: 我覺得決定要用哪種conv的重點是看你希望抽出來的feature是 04/04 01:45
7F:→ kaltu: 幾D 04/04 01:45
8F:→ kaltu: 醫學影像的3D,例如MRI或CT斷層掃出來就是真3D volume HxWx 04/04 01:45
9F:→ kaltu: D,這個時候因為預期的feature會是3D所以就很常用3D卷積保 04/04 01:45
10F:→ kaltu: 留D軸的空間資訊 04/04 01:45
11F:→ kaltu: 所以如果你覺得你的應用,第三軸的空間關係是重要feature的 04/04 01:45
12F:→ kaltu: 話,使用3D卷積不是不行 04/04 01:45
13F:→ kaltu: 順帶一提convXD的X代表的是輸出的shape是filter個X維度的X+ 04/04 01:45
14F:→ kaltu: 1維張量 04/04 01:45
15F:→ kaltu: 像RGB影像做conv2D,kernel其實是3D的,第一層設定5x5 filt 04/04 01:45
16F:→ kaltu: er其實是5x5x3 04/04 01:45
17F:→ kaltu: 舉例來說有些大量filter的conv層後面會有1x1卷積,意思是1x 04/04 01:45
18F:→ kaltu: 1x256之類的把前面長太多的filter壓扁回來 04/04 01:45
19F:→ s1010257: 好,謝謝你詳細的說明^^ 04/22 21:46
20F:→ diabolica: 最近剛好也在思考這種問題 04/22 21:47