作者yoco (眠月)
看板Prob_Solve
標題[問題] 容錯字串搜索
時間Wed Nov 16 18:08:37 2016
有問題想要請教資料結構演算法們的大大 <(_ _)>
最近無聊,想要作個 personal project:search engine
我知道怎麼在字串裡面作快速的精準搜索,比方說 KMP、BM、 suffix tree 之類
但我不知道怎麼作快速的模糊搜索 @@
想請各位前輩給一些資料、方向、關鍵字,感謝萬分。
ps. 如果能順便有如何在硬碟上有效率的保存 index 的相關資料那就更好了 XD
--
To iterate is human, to recurse, divine. L. Peter Deutsch 嫩嫩迴圈 大大遞迴
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.243.177.112
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Prob_Solve/M.1479290922.A.BE6.html
1F:推 FRAXIS: 你要先定義什麼叫做模糊 11/16 22:08
2F:→ FRAXIS: k-mismatch 容許k個字元錯 11/16 22:10
3F:→ FRAXIS: k-difference: edit distance 小於 k 11/16 22:10
4F:→ pttworld: 多年前修課使用foxpro,也沒發揮真正的威力。 11/16 23:53
5F:推 DJWS: bloom filter 11/17 05:12
6F:推 DJWS: 硬碟保存就 B-tree 吧 剛剛谷歌一下還有啥 CPS-tree 11/17 05:18
7F:→ yoco: 感謝各位 XD 11/18 02:57
8F:→ tonytonyjan: 限英文的話可用 soundex,pg、mysql 都有支援 11/20 02:25
9F:推 DJWS: 聲紋比對的話 實務上比較常見到 hidden markov model 11/20 06:30
10F:→ DJWS: ^^^^^^^^發音比對 更正一下 11/20 06:33
11F:→ yoco: 聲音比對現在主流不是 LSTM-RNN 了嗎 XD 11/28 02:14
12F:推 DJWS: LTSM-RNN 實驗室才剛做出來沒多久 應該還沒普及? 11/28 09:05
13F:→ yoco: 這個領域三個月就翻兩翻了... 12/01 23:34
14F:推 DJWS: 這麼快?可以請你提供統計數據來源嗎? 12/02 06:52