作者peter308 (pete)
看板DataScience
标题[讨论] 分团问题!?
时间Tue May 8 11:58:04 2018
在处理庞大的数据的时候
经常会透过分团(Clique, cluster analysis) 来将数据做分类
我最近有观察到这种分团问题都会附带一个关联矩阵
这个矩阵的长相大致上如下:
https://i.imgur.com/IgE8Y75.jpg
因为我之前修群论的时候
对於这样的图形常常接触
像有一本量子力学的教科书的封面就是这类型的矩阵
https://i.imgur.com/I9Aa6cU.jpg
通常有这样的图形出现就表示系统有某种对称性!
不知道各位在数据科学领域(非我的专长)
可有听过有什麽样的对称性的状况或是讨论吗??
感谢!!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.127.233.55
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1525751889.A.25A.html
1F:推 goldflower: 还以为是Gasiorowicz 05/08 12:53
2F:推 siscon: A对B有关系的话 B对A可能常常也会有关系吧 就只是这样 05/08 19:08
3F:推 goldflower: 不知道"Dual Learning for Machine Translation" 05/08 19:49
4F:→ goldflower: 这篇是不是你指的相关讨论 05/08 19:50
5F:推 littleyuan: 比较深的两者有关性高 最深的连成一条线是因为对映到 05/08 19:56
6F:→ littleyuan: 自己押 05/08 19:56
7F:推 p122607: 生物资讯方面常出现类似的热图 05/09 02:00
8F:→ p122607: 例如基因晶片的相关系数热图 05/09 02:01
这样热图矩阵
在群论有个专有名词叫做"Block diagonal matrix"
通常指系统的本徵态有不可化约的性质
(不可化约的意思,你无法再把矩阵透过某种转换将block的维度再变小)
block matrix 中的本徵态是简并的,这意味系统具有某种对称性!
因为"简并"就是系统具有某种对称性的一种表徵。
这我认为是非常有趣的,因为这可以解释
为什麽这些数据会有clustering或形成社群的现象。
※ 编辑: peter308 (140.127.233.55), 05/09/2018 10:22:49
9F:推 ray39620: 蛮有趣的。不过covariance matrix本身就是symmetric 05/09 10:31
10F:→ ray39620: 不是diagonal。所以仍可能透过svd method 得到降维结果 05/09 10:33
11F:→ ray39620: 对物理上讨论的对称比较不熟xD 05/09 10:34
12F:推 bestchiao: 这应该是hierarchical clustering吧 05/09 10:56
13F:推 bestchiao: 此外 关联矩阵不是都有对称性? 通常只看他的上半或下半 05/09 10:59
14F:→ bestchiao: 部进行讨论吧? 05/09 10:59
15F:推 bestchiao: 那再进行clustering则是进一步探讨矩阵中特徵的相似性 05/09 11:01
16F:→ bestchiao: 不知这样解释对不对 05/09 11:01
17F:推 p122607: 我的了解跟楼上一样 使用这图都为了看不同个体间的相似度 05/09 13:06