作者skulddio (飞天猫)
看板CodeJob
标题[发案] (急)Java程式比较文件内容间相似度
时间Wed May 2 15:27:45 2007
状态 : 发包中
发案人 : 飞天猫
联络方式: PTT站内信箱
有效时间: 即日起至5/7
专案类型: 计算文件间相似度的Java程式
专案说明:
已有Java相关的Package提供,
只需将当中所需用到的Class拿来套用.
目标是将英文内容文件转成VSM(Vector Space Model),
得出代表每一文件的一组Vector後,
利用Cosine计算出两两网页间相似度,
输出一相似度矩阵.
技术需求: Java
预算 : 从优,可再详谈
接案者要求:希望能教我怎麽做,和讲解一些内部的观念
附注:有朋友能提供中文资讯检索的code sourcec或软体资讯嘛, 感谢
结案意见: (结案後自由填写,可以询问接案人愿不愿意暴光接案身份)
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 163.23.199.165