作者znmkhxrw (QQ)
看板DataScience
标题Re: [问题] 不同大小的图片能形成manifold吗?
时间Wed Nov 14 20:49:33 2018
※ 引述《CVPR (ICCV)》之铭言:
: 如果我有一张图片的数张不同大小版本
: 这些图片在高维空间也是形成manifold吗?
: 还是说不行?
不知道你要知道多细 单就你推文的"失真" 就只是upscale/downscale所用的演算法
进行的内插再取四舍五入的结果而已
而你不管用(1)nearest(直接找最近然後复制)
(2)bilinear(双线性内插 & 四舍五入)
(3)bicubic(双三叉值内插 & 四舍五入)
这些方式都有经过不连续函数的作用如下:
(1) step function
(2) bilinear form + 四舍五入(非线性)
(3) bicubic form(XD? 数学上没学过这种名称) + 四舍五入(非线性)
接着最重要的原因是影像所在的空间是
discrete(离散型)的
上面这些函数(或是做影像的神经网路的output最後要形成影像也是要四舍五入)
就只是把处在离散空间的影像打到另一个离散空间
因此单就"离散"来看 讨论流形是毫无意义的
离散空间本身是0维流形,就只是点
因此我推文才说,这些点你说他
座落在某个曲线(1维流形)、曲面(2维流形)...
都随你讲,数学上都是对的,也有无限多组解
所以要把这个问题有意义化,需要把空间
连续化
像是原本RGB三通道且宽=w, 高=h的影像空间纯粹同构於 D:={0,1,...,255}^(w*h*3)
将空间连续化自然就变成 C:= [0,1,...,255]^(w*h*3)
因此上面那三种演算法中的(2)(3)自然不用去四舍五入,保留前面连续函数的部分
而这两个连续函数的变数都只有两个且都是无穷可微函数,令为f
因此f(C)是一个可微二维流形
总结来说,在问"拉伸同一张图片是否形成manifold"前,要先问
(1)你的manifold定义是什麽
(2)你的拉伸演算法是什麽
如果都无法明确定义,或是只是一种"感觉"罢了,那就不用太care这个问题了XDD
像是我把一张图片每次旋转1度形成360张图
然後用UMAP流形降维再用tensorboard画3D图
确实这些点如预期的形成一个环 = 一维流形
符合变数只有一个 = 角度
把这些点看成佛珠的话,人类很直觉会把他代入成一个环(圆环线串起来)
但是数学上有无穷多种可能的线去穿过全部的佛珠
-----------------------------------------------------------------
一开始接触ML/DL时看到manifold learning很兴奋 看如何跟黎曼流形连结
直到我看到了这句:这里所称的流形与数学上不太一样 纯粹是个概念( ′-`)y-~
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 175.99.149.254
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1542199776.A.3FC.html
1F:推 CVPR: 感谢回覆 11/15 00:34
2F:推 nf0126: ML/DL很多数学不是真的那个定义,而是借用概念 11/17 12:14