CSSE 板


LINE

※ 引述《reader (讀者)》之銘言: : 既然講到了演算法的實證資料,就想起這一篇文章: : http://www.fantasy-coders.de/projects/gh/html/x435.html : 算是很不錯的 string hash function performance 資料,不過是 : 德文的,幸好圖表很多,看圖大概也能看懂,也有列出程式碼。 : 我以前是用 DJB2, 一直很煩惱要不要用 FNV, 但看過這一篇之後, : 就決定改用 FNV 了。 : string hash function 在有大量會員,需要高效率的登入功能的 : 高負載網路服務,就顯得十分重要了。 現在有新的實證研究了: http://smallcode.weblogs.us/2008/01/22/hash-functions-an-empirical-comparison/ http://smallcode.weblogs.us/2008/02/04/hash-functions-additional-tests/ http://smallcode.weblogs.us/2008/02/12/hash-functions-part-3/ http://smallcode.weblogs.us/2008/06/17/murmur-hash/ 而我自己根據這幾篇研究,試做了一個 x273 的方法: UINT Hash273(const CHAR *key, SIZE_T len) { UINT hash = 0; UINT i = 0; UINT n = (UINT)len & -4; UINT e = (UINT)len - n; for(; i < n; i += 4) { hash = 273 * hash + key[i + 0]; hash = 273 * hash + key[i + 1]; hash = 273 * hash + key[i + 2]; hash = 273 * hash + key[i + 3]; } if(e == 0) return hash; hash = 273 * hash + key[i + 0]; if(e == 1) return hash; hash = 273 * hash + key[i + 1]; if(e == 2) return hash; hash = 273 * hash + key[i + 2]; return hash; } (以上程式風格是為了嵌入這一系列文章的程式碼而寫成這樣的。 已做了速度最佳化處理。) 結果是: Words Win32 Numbers Prefix Postfix Variables Shakespeare Bernstein 146 879 426 326 315 651 875 K&R 143 890 867 329 320 657 886 x17 137 848 81 317 299 639 831 x17 unrolled 132 826 84 307 292 622 806 x65599 139 846 207 320 317 639 836 FNV-1a 151 961 88 368 357 693 907 universal 155 981 91 376 366 705 923 Weinberger 168 1205 272 483 472 831 1068 Paul Hsieh 156 840 110 292 275 660 951 One At Time 161 1024 103 393 377 741 961 lookup3 153 846 92 290 278 665 948 Arash Partow 152 978 1046 384 362 717 928 CRC-32 158 1010 79 386 366 719 950 Ramakrishna 152 955 211 370 351 704 925 Fletcher 139 677 1178 261 229 593 1254 Murmur2 135 771 85 265 251 607 831 x273 129 748 70 248 243 591 802 (Adler-32 的結果太糟糕,我直接砍了) 好像就這樣不小心被我弄出了一個在這一張表中, 看起來是效率第一名的新字串雜湊函數 XD 所以在這邊推薦使用的公式是: hash(n+1) = hash(n) * 273 + char(n) --



※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 82.103.134.5 ※ 編輯: reader 來自: 82.103.134.5 (12/14 21:06)
1F:推 AlanSung:(Y) 12/14 22:59
2F:推 tinlans:有跟 ternary search tree 的比較嗎? 12/15 02:05
3F:→ reader:這跟 ternary search tree 是不能比較的... 不同的東西 12/15 04:54
4F:→ reader:光是 tree 的最佳化就是一個超大麻煩... 12/15 05:22
5F:→ reader:理論上 TST 不必訪問所有字元應該比較快 12/15 05:29
6F:→ reader:但實務上 tree 結構的效能都很可疑 這很難處理 12/15 05:31







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:BuyTogether站內搜尋

TOP