作者linkidd2 (超浪漫賽車手)
看板Programming
標題[請益] Cosine similarity的疑問
時間Fri Oct 16 17:51:33 2009
因為這個演算法問題我也不知道該PO在哪,如果不符板歸我會自刪,感謝
請問各位強者,用Cosine similarity來作中文字和英文字的相似度有差別嗎?
由於是給予自詞特徵之後在計算其向量差距,而由於中文字和英文字的差異,
中文可能一個字也有意思,而英文必須要組合的單詞才會有特徵,
所以是否用這個方法來分別計算中英文相似度是否有差距?
還是這個方法比較適用於中文字的相似度計算呢?
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.119.19.57
1F:推 bcse:並不會比較不適合英文,針對英文的相關研究也 59.115.213.113 10/17 19:49
2F:→ bcse:常用到 Cosine similarity 59.115.213.113 10/17 19:50
3F:→ linkidd2:那請問會比較適合用中文嗎?因為在研討會 140.119.19.57 10/17 22:28
4F:→ linkidd2:上,演講者被問到這個問題,他說中文比較適 140.119.19.57 10/17 22:28
5F:→ linkidd2:和CS方法,但是我們老師認為是虎爛的 140.119.19.57 10/17 22:29
6F:→ linkidd2:要我去查....囧 140.119.19.57 10/17 22:29
7F:→ bcse:你何不去問演講者,我猜那是他的個人看法。 59.115.213.113 10/17 23:04
8F:→ bcse:依照我個人的實驗結果是:「沒差。」 59.115.213.113 10/17 23:06
9F:→ linkidd2:因為時間不足阿= =所以就沒深究下去了 140.119.19.57 10/18 00:13
10F:→ linkidd2:不過還是很感謝你 140.119.19.57 10/18 00:13