作者linkidd2 (超浪漫赛车手)
看板CSSE
标题[请益] 请问Cosine similarity演算法问题
时间Fri Oct 16 17:53:05 2009
有个问题思考很久,
因为这个演算法问题我也不知道该PO在哪,如果不符板归我会自删,感谢
请问各位强者,用Cosine similarity来作中文字和英文字的相似度有差别吗?
由於是给予自词特徵之後在计算其向量差距,而由於中文字和英文字的差异,
中文可能一个字也有意思,而英文必须要组合的单词才会有特徵,
所以是否用这个方法来分别计算中英文相似度是否有差距?
还是这个方法比较适用於中文字的相似度计算呢?
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.119.19.57
1F:推 cansas:中文可能要使用断字的系统 中研院好像有 用了应该就跟英文 10/17 02:49
2F:→ cansas:的cosin similarity一样了 10/17 02:49
3F:推 wa120:主要重点在特徵直的取得! 而不是在相似演算法 10/17 20:03