作者ID5 (当木头遇上啄木鸟)
看板ACMCLUB
标题Re: [问题] 文件比对
时间Sat Jun 17 12:59:44 2006
※ 引述《kc655039 (NNN  )》之铭言:
: 在这边问似乎不太适合
: 但是还是想了解一下文件比对的算法
: 就是如果要拿两个文件来比对,
: 看看相似的程度如何,
: 这当然要有人先定义出相似度才能开始解,
: 请问一下,有没有已经纯在的算法??
: 就是那种经典的算法可以参考看看?
: 如果有先进曾听说过哪个论文或是书籍的话
: 希望可介绍参考,感激
请找 IR 相关的书 (information retrieval),
例如下面这本是以前资讯检索这门课的课本:
Baeza-Yates, R. and Ribeiro-Neto, B.
Modern Information Retrieval, Addison Wesley, 1999.
然後找 vector space model.
另外, 这是网路上刚刚找到的简介:
http://isp.imm.dtu.dk/thor/projects/multimedia/textmining/node5.html
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.112.30.53