作者s1010257 (波)
看板DataScience
标题[问题] conv3D
时间Fri Apr 3 04:18:55 2020
作业系统: win10
问题类别: Conv3D
使用工具: keras、tensorflow
问题内容:
最近在翻keras.io文件 看到conv input shape
目前练习的影像辨识图片都是透过conv2D进行卷积
那如果透过3D摄影机撷取的影像多了纵深的维度是否透过conv3d进行卷积?
对於3d影像的维度其实不是很了解
想请问想法是否正确
或是有没有一些透过3D影像分析的文章可供参考?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.235.118.45 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1585858737.A.C0E.html
1F:推 guestttttt: 一般影像是RGB三channel, 3d影像是RGBD四channel 04/03 13:13
2F:→ guestttttt: 只是多一个channel, 应该还是用conv2D 04/03 13:14
4F:推 zxp9505007: 3D通常是用来分析点云图或是CAD图 而非影像 04/03 15:14
5F:→ s1010257: 好 谢谢你们的回覆 会在多去了解! 04/03 15:43
6F:推 kaltu: 我觉得决定要用哪种conv的重点是看你希望抽出来的feature是 04/04 01:45
7F:→ kaltu: 几D 04/04 01:45
8F:→ kaltu: 医学影像的3D,例如MRI或CT断层扫出来就是真3D volume HxWx 04/04 01:45
9F:→ kaltu: D,这个时候因为预期的feature会是3D所以就很常用3D卷积保 04/04 01:45
10F:→ kaltu: 留D轴的空间资讯 04/04 01:45
11F:→ kaltu: 所以如果你觉得你的应用,第三轴的空间关系是重要feature的 04/04 01:45
12F:→ kaltu: 话,使用3D卷积不是不行 04/04 01:45
13F:→ kaltu: 顺带一提convXD的X代表的是输出的shape是filter个X维度的X+ 04/04 01:45
14F:→ kaltu: 1维张量 04/04 01:45
15F:→ kaltu: 像RGB影像做conv2D,kernel其实是3D的,第一层设定5x5 filt 04/04 01:45
16F:→ kaltu: er其实是5x5x3 04/04 01:45
17F:→ kaltu: 举例来说有些大量filter的conv层後面会有1x1卷积,意思是1x 04/04 01:45
18F:→ kaltu: 1x256之类的把前面长太多的filter压扁回来 04/04 01:45
19F:→ s1010257: 好,谢谢你详细的说明^^ 04/22 21:46
20F:→ diabolica: 最近刚好也在思考这种问题 04/22 21:47