Re: 请问有关Hash演算法

时间Fri Aug 11 21:54:11 2006

※ 引述《Killercat (杀人猫™)》之铭言： : ※ 引述《[email protected] (丁香鱼)》之铭言： : : 请问各位专家 : : 目前常见的hash方法有 md5 checksum crc ...等等 : : 但是这几种方法只要档案有稍许的不同...所算出来的hash value : : 就会天差地远.... : : 想请问的就是有哪个hash方法是 : : 假设影两个档案A和B 如果A 和B 的差异只有一点点(可能几个bit不同) : : 然後有哪个hash方法所算出的hash value也是只有差异一些些!! : 那个不叫hash, 那叫做特徵码 : 通常使用於病毒的变种防护上. : 这东西很多防毒软体引擎都或多或少会设计一些这类型的特徵码 : 不过这基本上跟hash毫无关系, 只是把一些特徵index起来而已 : 因为病毒体积都不大(总不太可能有500mb的病毒吧? 这应该叫做恶意程式了) : 所以"特徵"也比较少, 特徵码也不至於长到不能用的地步 : 如果你是拿来做一般档案编码的话, 那这个index所需要纪录的资料 : 远远不是hash能比的大小 =) 是的，那确实不是 hash 的用途，因为 hash 的基础是 pseudo random number。你需要的是到 Google Scholar 找几个关键字（愈底下的愈粗略）： similarity (string or text, PCMan 提到的 edit distance 就是这类) fingerprint (data mining) text clustering (not computer cluster) text classification information extraction information retrieval --

※ 发信站: 批踢踢实业坊(ptt.cc) ◆ From: 59.105.131.104

赞助商连结

您可能会有兴趣的文章

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称，例如：BuyTogether 或站内搜寻

TOP

WEB批踢踢(PTT)

Programming 板

Re: 请问有关Hash演算法

热门看板

赞助商连结