作者yoco (眠月)
看板Prob_Solve
标题[问题] 容错字串搜索
时间Wed Nov 16 18:08:37 2016
有问题想要请教资料结构演算法们的大大 <(_ _)>
最近无聊,想要作个 personal project:search engine
我知道怎麽在字串里面作快速的精准搜索,比方说 KMP、BM、 suffix tree 之类
但我不知道怎麽作快速的模糊搜索 @@
想请各位前辈给一些资料、方向、关键字,感谢万分。
ps. 如果能顺便有如何在硬碟上有效率的保存 index 的相关资料那就更好了 XD
--
To iterate is human, to recurse, divine. L. Peter Deutsch 嫩嫩回圈 大大递回
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.243.177.112
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Prob_Solve/M.1479290922.A.BE6.html
1F:推 FRAXIS: 你要先定义什麽叫做模糊 11/16 22:08
2F:→ FRAXIS: k-mismatch 容许k个字元错 11/16 22:10
3F:→ FRAXIS: k-difference: edit distance 小於 k 11/16 22:10
4F:→ pttworld: 多年前修课使用foxpro,也没发挥真正的威力。 11/16 23:53
5F:推 DJWS: bloom filter 11/17 05:12
6F:推 DJWS: 硬碟保存就 B-tree 吧 刚刚谷歌一下还有啥 CPS-tree 11/17 05:18
7F:→ yoco: 感谢各位 XD 11/18 02:57
8F:→ tonytonyjan: 限英文的话可用 soundex,pg、mysql 都有支援 11/20 02:25
9F:推 DJWS: 声纹比对的话 实务上比较常见到 hidden markov model 11/20 06:30
10F:→ DJWS: ^^^^^^^^发音比对 更正一下 11/20 06:33
11F:→ yoco: 声音比对现在主流不是 LSTM-RNN 了吗 XD 11/28 02:14
12F:推 DJWS: LTSM-RNN 实验室才刚做出来没多久 应该还没普及? 11/28 09:05
13F:→ yoco: 这个领域三个月就翻两翻了... 12/01 23:34
14F:推 DJWS: 这麽快?可以请你提供统计数据来源吗? 12/02 06:52