作者jimmy12332 (123)
看板DataScience
标题[问题] 如何对有多种尺度属性的资料分群?
时间Wed Oct 24 18:16:09 2018
大家好,最近在读有关分群的章节
但是书上对於分群演算法总是只考虑数值变数
但是常常资料时有很多种尺度的
例如我可能有一笔资料记录着一些人的讯息
可能有他的年纪,身高,体重,有没有房子,开什麽车,种族,收入,任职的公司 等等变数
有没有什麽好方法可以衡量两笔资料之间的相似或相异度?一般来说是如何对这种资料做分群的呢?
-----
Sent from JPTT on my Sony D6653.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.138.56.115
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1540376173.A.A05.html
1F:→ yoyololicon: 多尺度是指多维ㄇ10/24 19:37
不是耶 像是例如年纪是interval尺度 开什麽车是nominal尺度之类的
2F:推 celestialgod: t-SNE或是Gower’s distance10/24 19:58
感谢,刚刚有查到Gower跟k-prototype,t-SNE会去看看
※ 编辑: jimmy12332 (223.138.56.115), 10/24/2018 20:56:17
※ 编辑: jimmy12332 (223.138.56.115), 10/24/2018 20:58:20
3F:推 AgileSeptor: 如果是k means分群,是需要做scaling的 10/25 01:42
5F:推 acctouhou: 直接做 z score ? 10/25 11:01