作者bulwarktw (Bulwark)
看板PHP
标题[请益] 给一段文字,分析 yahoo/google 关键字
时间Mon Mar 19 01:05:05 2012
各位好,
最近看到一个 php 写的网页,可以做到中文分词功能,
似乎是透过比对 yahoo 的关键字?
网址是:
http://2.oni.tw/2011/07/blog-post_25.html
点选 ycas.php 的连结,输入文字,
例如输入「海绵宝宝说他喜欢打棒球耶」
他就会分析出「海绵宝宝,打棒球,海绵,宝宝,喜欢」
这些关键字。
因为自己做的分词系统,通常无法解析出「海绵宝宝」
而会拆成「海绵」和「宝宝」两个关键字,
但是透过搜寻引擎的话「海绵宝宝」
这个关键字就能被拆解出来。
请问有没有朋友知道其中奥妙?到底是怎麽做到的。
感谢~
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 123.193.4.113
1F:→ shadowjohn:长字串优先拆啊@_@? 03/19 04:02
3F:→ terrybob:db这边以字串数字大先排列,server以db资料作分解… 03/19 13:04
4F:→ bulwarktw:原来 yahoo 有「断章取义」这种 api :) 03/19 23:26