作者bulwarktw (Bulwark)
看板PHP
標題[請益] 給一段文字,分析 yahoo/google 關鍵字
時間Mon Mar 19 01:05:05 2012
各位好,
最近看到一個 php 寫的網頁,可以做到中文分詞功能,
似乎是透過比對 yahoo 的關鍵字?
網址是:
http://2.oni.tw/2011/07/blog-post_25.html
點選 ycas.php 的連結,輸入文字,
例如輸入「海綿寶寶說他喜歡打棒球耶」
他就會分析出「海綿寶寶,打棒球,海綿,寶寶,喜歡」
這些關鍵字。
因為自己做的分詞系統,通常無法解析出「海綿寶寶」
而會拆成「海綿」和「寶寶」兩個關鍵字,
但是透過搜尋引擎的話「海綿寶寶」
這個關鍵字就能被拆解出來。
請問有沒有朋友知道其中奧妙?到底是怎麼做到的。
感謝~
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.193.4.113
1F:→ shadowjohn:長字串優先拆啊@_@? 03/19 04:02
3F:→ terrybob:db這邊以字串數字大先排列,server以db資料作分解… 03/19 13:04
4F:→ bulwarktw:原來 yahoo 有「斷章取義」這種 api :) 03/19 23:26