作者hipya ()
看板MATLAB
標題[討論] 資料分布
時間Thu Nov 14 14:30:03 2013
假設有兩筆資料
根據這兩筆資料畫出scatter diagram後
會有一塊明顯集中的區域以及其他比較鬆散的區域
若是想要只取集中的區域內的data做分析,捨去鬆散的區域的data
這個作法是有什麼相關的理論嗎?
在matlab上面該如何執行
感激不盡!!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.19.237
1F:推 BahasaMelayu:kmeans 11/14 15:55
2F:→ hipya:樓上 請問跑kmeans他會自己找出最密集的區塊嗎 還是有手動 11/14 17:27
3F:→ hipya:輸入呢? 11/14 17:28
4F:推 doom8199:kmeans 是 greedy alg. 原po只能多跑幾輪 kmeans 11/14 17:40
5F:→ hipya:可是我只是要找出一個cluster就好,就是找資料內最密集的 11/14 17:50
6F:→ hipya:區域,其餘的都捨去掉 11/14 17:50
7F:→ hipya:當資料間沒有明顯的區隔時,要如何把較為散開的點給去除? 11/14 17:53
8F:推 doom8199:若對資料的 distribution 不是很了解 11/14 17:54
9F:→ doom8199:我是覺得可以用 mean-shift 來求得 11/14 17:55
10F:→ doom8199:而稀疏區域排除,得看你所選取的 ROI 大小為何才能決定 11/14 17:56