作者linkidd2 (超浪漫賽車手)
看板CSSE
標題[請益] 請問Cosine similarity演算法問題
時間Fri Oct 16 17:53:05 2009
有個問題思考很久,
因為這個演算法問題我也不知道該PO在哪,如果不符板歸我會自刪,感謝
請問各位強者,用Cosine similarity來作中文字和英文字的相似度有差別嗎?
由於是給予自詞特徵之後在計算其向量差距,而由於中文字和英文字的差異,
中文可能一個字也有意思,而英文必須要組合的單詞才會有特徵,
所以是否用這個方法來分別計算中英文相似度是否有差距?
還是這個方法比較適用於中文字的相似度計算呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.119.19.57
1F:推 cansas:中文可能要使用斷字的系統 中研院好像有 用了應該就跟英文 10/17 02:49
2F:→ cansas:的cosin similarity一樣了 10/17 02:49
3F:推 wa120:主要重點在特徵直的取得! 而不是在相似演算法 10/17 20:03