作者ianting (Pseudo-romantic)
看板Statistics
标题[问题] 请问复选题可以跑群聚分析吗?
时间Tue Sep 22 12:07:12 2015
各位高手好,
小弟手边有一笔复选题的资料,
例题如下:
1. 请问您周末会进行哪些休闲活动?
□运动 □看书 □玩电脑 □唱歌 □看电视 □园艺...
类似的题目有十题以上,每题选项不一定相同。
我对每一题
分别进行阶层性群聚分析(hierarchical cluster analysis),
也就是说以下讨论都是对单个题目,不同选项之间的讨论,
并没有涉及不同题目之间的群聚分析。
我使用Eucidian Sqaured Distance计算
选项之间的距离。
我不是计算样本,而是计算选项之间的距离,是因为尚未厘清变项间的关联。
问题如下:
1. 请问cluster analysis如何计算非categorical变项之间的「距离」?
我看了网路上写的距离计算公式,但不清楚如何计算Xij-Yij。
2. 请问如何解释变项之间的距离?是不是:
有勾选A变项的资料点的「某个值」的平均值以及
有勾选B变项的资料点的「某个值」的平均值之间的距离?
我「某个值」的意思是因为我不太清楚复选题(categorical data)要如何算距离,
或是距离的平均值。
拜托各位了,谢谢各位!
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.218.221.17
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1442894835.A.78A.html
1F:→ recorriendo: 每个选项视为binary vector 09/28 01:16
2F:→ recorriendo: 1代表受试者有选 0代表没选 这样算Euclidean distanc 09/28 01:17