作者peter308 (pete)
看板DataScience
標題[討論] 分團問題!?
時間Tue May 8 11:58:04 2018
在處理龐大的數據的時候
經常會透過分團(Clique, cluster analysis) 來將數據做分類
我最近有觀察到這種分團問題都會附帶一個關聯矩陣
這個矩陣的長相大致上如下:
https://i.imgur.com/IgE8Y75.jpg
因為我之前修群論的時候
對於這樣的圖形常常接觸
像有一本量子力學的教科書的封面就是這類型的矩陣
https://i.imgur.com/I9Aa6cU.jpg
通常有這樣的圖形出現就表示系統有某種對稱性!
不知道各位在數據科學領域(非我的專長)
可有聽過有什麼樣的對稱性的狀況或是討論嗎??
感謝!!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.127.233.55
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1525751889.A.25A.html
1F:推 goldflower: 還以為是Gasiorowicz 05/08 12:53
2F:推 siscon: A對B有關係的話 B對A可能常常也會有關係吧 就只是這樣 05/08 19:08
3F:推 goldflower: 不知道"Dual Learning for Machine Translation" 05/08 19:49
4F:→ goldflower: 這篇是不是你指的相關討論 05/08 19:50
5F:推 littleyuan: 比較深的兩者有關性高 最深的連成一條線是因為對映到 05/08 19:56
6F:→ littleyuan: 自己押 05/08 19:56
7F:推 p122607: 生物資訊方面常出現類似的熱圖 05/09 02:00
8F:→ p122607: 例如基因晶片的相關係數熱圖 05/09 02:01
這樣熱圖矩陣
在群論有個專有名詞叫做"Block diagonal matrix"
通常指系統的本徵態有不可化約的性質
(不可化約的意思,你無法再把矩陣透過某種轉換將block的維度再變小)
block matrix 中的本徵態是簡併的,這意味系統具有某種對稱性!
因為"簡併"就是系統具有某種對稱性的一種表徵。
這我認為是非常有趣的,因為這可以解釋
為什麼這些數據會有clustering或形成社群的現象。
※ 編輯: peter308 (140.127.233.55), 05/09/2018 10:22:49
9F:推 ray39620: 蠻有趣的。不過covariance matrix本身就是symmetric 05/09 10:31
10F:→ ray39620: 不是diagonal。所以仍可能透過svd method 得到降維結果 05/09 10:33
11F:→ ray39620: 對物理上討論的對稱比較不熟xD 05/09 10:34
12F:推 bestchiao: 這應該是hierarchical clustering吧 05/09 10:56
13F:推 bestchiao: 此外 關聯矩陣不是都有對稱性? 通常只看他的上半或下半 05/09 10:59
14F:→ bestchiao: 部進行討論吧? 05/09 10:59
15F:推 bestchiao: 那再進行clustering則是進一步探討矩陣中特徵的相似性 05/09 11:01
16F:→ bestchiao: 不知這樣解釋對不對 05/09 11:01
17F:推 p122607: 我的了解跟樓上一樣 使用這圖都為了看不同個體間的相似度 05/09 13:06