作者folksuite (Z)
看板Statistics
標題[程式] SPSS k-means 與 stata, sklearn 不同
時間Tue Jun 1 20:44:54 2021
[軟體程式類別]: SPSS, Stata, Python_sklearn
[程式問題]: SPSS k-means 與另外兩個不同
[軟體熟悉度]: 新手
[問題敘述]:
課程助教是用 SPSS 跑 k-means,
我是用 Stata 跟 sklearn 跑,
Stata 跟 sklearn 的結果相同,
SPSS 結果不同,想知道差異在哪,
(是SPSS計算距離的方式不同??)
要如何讓三者結果相同。
[程式範例]:
Colab:
https://tinyurl.com/2drtnpux
SPSS:
QUICK CLUSTER x1 x2
/MISSING=LISTWISE
/CRITERIA=CLUSTER(3) MXITER(50) CONVERGE(0)
/METHOD=KMEANS(NOUPDATE)
/SAVE CLUSTER
/PRINT INITIAL.
Stata:
cluster kmeans X1 X2, k(3) measure(L2) name(Stata) start(krandom) iterate(50)
Python:
kmeans = KMeans(n_clusters=3, max_iter=50, random_state=0)
kmeans.fit(df[['x1','x2']])
k_means = kmeans.predict(df[['x1','x2']])
df['sklearn'] = k_means # df['k_means']
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.84.253.225 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1622551499.A.C67.html
1F:→ andrew43: 先確定是不是隨機性造成。kmeans過程是有隨機性的。 06/02 00:04
2F:→ JamesChen: 還有確定一下助教是不是錯的 06/02 09:17
3F:→ folksuite: 感謝兩位回復~ 我再研究研究 06/02 20:58