作者linkidd2 (超浪漫赛车手)
看板Programming
标题[请益] Cosine similarity的疑问
时间Fri Oct 16 17:51:33 2009
因为这个演算法问题我也不知道该PO在哪,如果不符板归我会自删,感谢
请问各位强者,用Cosine similarity来作中文字和英文字的相似度有差别吗?
由於是给予自词特徵之後在计算其向量差距,而由於中文字和英文字的差异,
中文可能一个字也有意思,而英文必须要组合的单词才会有特徵,
所以是否用这个方法来分别计算中英文相似度是否有差距?
还是这个方法比较适用於中文字的相似度计算呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.119.19.57
1F:推 bcse:并不会比较不适合英文,针对英文的相关研究也 59.115.213.113 10/17 19:49
2F:→ bcse:常用到 Cosine similarity 59.115.213.113 10/17 19:50
3F:→ linkidd2:那请问会比较适合用中文吗?因为在研讨会 140.119.19.57 10/17 22:28
4F:→ linkidd2:上,演讲者被问到这个问题,他说中文比较适 140.119.19.57 10/17 22:28
5F:→ linkidd2:和CS方法,但是我们老师认为是虎烂的 140.119.19.57 10/17 22:29
6F:→ linkidd2:要我去查....囧 140.119.19.57 10/17 22:29
7F:→ bcse:你何不去问演讲者,我猜那是他的个人看法。 59.115.213.113 10/17 23:04
8F:→ bcse:依照我个人的实验结果是:「没差。」 59.115.213.113 10/17 23:06
9F:→ linkidd2:因为时间不足阿= =所以就没深究下去了 140.119.19.57 10/18 00:13
10F:→ linkidd2:不过还是很感谢你 140.119.19.57 10/18 00:13