作者folksuite (Z)
看板Statistics
标题[程式] SPSS k-means 与 stata, sklearn 不同
时间Tue Jun 1 20:44:54 2021
[软体程式类别]: SPSS, Stata, Python_sklearn
[程式问题]: SPSS k-means 与另外两个不同
[软体熟悉度]: 新手
[问题叙述]:
课程助教是用 SPSS 跑 k-means,
我是用 Stata 跟 sklearn 跑,
Stata 跟 sklearn 的结果相同,
SPSS 结果不同,想知道差异在哪,
(是SPSS计算距离的方式不同??)
要如何让三者结果相同。
[程式范例]:
Colab:
https://tinyurl.com/2drtnpux
SPSS:
QUICK CLUSTER x1 x2
/MISSING=LISTWISE
/CRITERIA=CLUSTER(3) MXITER(50) CONVERGE(0)
/METHOD=KMEANS(NOUPDATE)
/SAVE CLUSTER
/PRINT INITIAL.
Stata:
cluster kmeans X1 X2, k(3) measure(L2) name(Stata) start(krandom) iterate(50)
Python:
kmeans = KMeans(n_clusters=3, max_iter=50, random_state=0)
kmeans.fit(df[['x1','x2']])
k_means = kmeans.predict(df[['x1','x2']])
df['sklearn'] = k_means # df['k_means']
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 219.84.253.225 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1622551499.A.C67.html
1F:→ andrew43: 先确定是不是随机性造成。kmeans过程是有随机性的。 06/02 00:04
2F:→ JamesChen: 还有确定一下助教是不是错的 06/02 09:17
3F:→ folksuite: 感谢两位回复~ 我再研究研究 06/02 20:58