CSSE 板


LINE

※ 引述《reader (读者)》之铭言: : 既然讲到了演算法的实证资料,就想起这一篇文章: : http://www.fantasy-coders.de/projects/gh/html/x435.html : 算是很不错的 string hash function performance 资料,不过是 : 德文的,幸好图表很多,看图大概也能看懂,也有列出程式码。 : 我以前是用 DJB2, 一直很烦恼要不要用 FNV, 但看过这一篇之後, : 就决定改用 FNV 了。 : string hash function 在有大量会员,需要高效率的登入功能的 : 高负载网路服务,就显得十分重要了。 现在有新的实证研究了: http://smallcode.weblogs.us/2008/01/22/hash-functions-an-empirical-comparison/ http://smallcode.weblogs.us/2008/02/04/hash-functions-additional-tests/ http://smallcode.weblogs.us/2008/02/12/hash-functions-part-3/ http://smallcode.weblogs.us/2008/06/17/murmur-hash/ 而我自己根据这几篇研究,试做了一个 x273 的方法: UINT Hash273(const CHAR *key, SIZE_T len) { UINT hash = 0; UINT i = 0; UINT n = (UINT)len & -4; UINT e = (UINT)len - n; for(; i < n; i += 4) { hash = 273 * hash + key[i + 0]; hash = 273 * hash + key[i + 1]; hash = 273 * hash + key[i + 2]; hash = 273 * hash + key[i + 3]; } if(e == 0) return hash; hash = 273 * hash + key[i + 0]; if(e == 1) return hash; hash = 273 * hash + key[i + 1]; if(e == 2) return hash; hash = 273 * hash + key[i + 2]; return hash; } (以上程式风格是为了嵌入这一系列文章的程式码而写成这样的。 已做了速度最佳化处理。) 结果是: Words Win32 Numbers Prefix Postfix Variables Shakespeare Bernstein 146 879 426 326 315 651 875 K&R 143 890 867 329 320 657 886 x17 137 848 81 317 299 639 831 x17 unrolled 132 826 84 307 292 622 806 x65599 139 846 207 320 317 639 836 FNV-1a 151 961 88 368 357 693 907 universal 155 981 91 376 366 705 923 Weinberger 168 1205 272 483 472 831 1068 Paul Hsieh 156 840 110 292 275 660 951 One At Time 161 1024 103 393 377 741 961 lookup3 153 846 92 290 278 665 948 Arash Partow 152 978 1046 384 362 717 928 CRC-32 158 1010 79 386 366 719 950 Ramakrishna 152 955 211 370 351 704 925 Fletcher 139 677 1178 261 229 593 1254 Murmur2 135 771 85 265 251 607 831 x273 129 748 70 248 243 591 802 (Adler-32 的结果太糟糕,我直接砍了) 好像就这样不小心被我弄出了一个在这一张表中, 看起来是效率第一名的新字串杂凑函数 XD 所以在这边推荐使用的公式是: hash(n+1) = hash(n) * 273 + char(n) --



※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 82.103.134.5 ※ 编辑: reader 来自: 82.103.134.5 (12/14 21:06)
1F:推 AlanSung:(Y) 12/14 22:59
2F:推 tinlans:有跟 ternary search tree 的比较吗? 12/15 02:05
3F:→ reader:这跟 ternary search tree 是不能比较的... 不同的东西 12/15 04:54
4F:→ reader:光是 tree 的最佳化就是一个超大麻烦... 12/15 05:22
5F:→ reader:理论上 TST 不必访问所有字元应该比较快 12/15 05:29
6F:→ reader:但实务上 tree 结构的效能都很可疑 这很难处理 12/15 05:31







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:e-shopping站内搜寻

TOP