作者airderek (此使用者离位)
看板HOT_Game
标题重贴 关於认证图的解码
时间Sat Jun 23 22:47:44 2007
※ 引述《caeru (星羽)》之铭言:
首先来探讨一下 MD5
这玩意主要是利用杂凑演算法,将档案计算出一个接近UNICODE的方式
意味着,除非这两个档案一模一样,不然 MD5 码肯定不同。
而现在要使认证码失效的方式如下:
1. 官方大量增图,用程式跑个1,000,000张图,粗估10小时内即可完成。
2. 随机产生图片,利用线上某微妙软体及时制造图片出来,这样子资料库再多资料都
没用。
3. 随机改变图片像素,以某些数量的图片档为基底,如5000张,送出前改变其中一个
像素的数值,就会让图的MD5档跟原始档完全不同,也会让资料库的辨识失效。
上述三种简易的方式都可以轻松破坏现行资料库的稳定性。
要应对的方式也不是没有:
1. 人力、人力、哈士奇。
2. 图片相关性验证,使用相关系数来测试图片有多接近。藉由这种方式来辅助资料库
辨识图片。这是中阶方法。
3. 线上字元辨识(OCR),这是终极方法。现阶段就跟太空旅行难度差不多...
发展出来万用prototype台湾就出名了。
以上...
结论是:
手动认证是目前唯一方法
___________________________________________________________________________
我(airderek)补充:
数字相同 但是後面的 MD5未必相同...
请大家文章都尽量爬一爬再来想...
物以为已为字母一样 但後面背景有点不同
依旧仍认为结果还是相同
有这麽好破 那麽雅虎即时通.. 不会采用这种认证....
除非辨识系统做出来...
要不然假使图不断出现新的..
那只会是个无底洞~
除非他是用有限资料库做...
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 218.166.240.111
1F:推 jhjhs33504:OP 06/23 22:47
2F:→ airderek:我重贴=.= 因为有人不懂 ... 06/23 22:48
3F:→ airderek:那文章被淹没了.. 06/23 22:48
4F:推 cat771126:目前根据dannyst大表示,官方是以一个比例在混合新旧图 06/23 22:48
5F:→ cat771126:一张图的存活时间很短,所以资料库是没用的 06/23 22:49
6F:→ airderek:怎样的比例呢?....周期有猜到吗?混合排列组合你能算出吗? 06/23 22:49
7F:→ whogotme:就像拍101大楼 有很多角度的照片 但结果都是101大楼 06/23 22:49
8F:→ airderek:一张图 是好几层做的 ...说比例很笼统 给数据比较实际 06/23 22:49
9F:→ cat771126:这要问dannyst大了 06/23 22:50
10F:→ airderek:光新旧混合就可以把你搞死了 抽一种颜色 跟 新的字母混 06/23 22:51
11F:→ airderek:如果线条扭曲 又变化 旋转角度 等等 06/23 22:51
12F:→ airderek:还有字母可能 可以加上不同腐蚀 每个动作的代表码不同 06/23 22:51
13F:推 cat771126:目前可以确定的是,一直建立资料库是没用的 06/23 22:52
14F:→ airderek:MD5是很多控制变因组合的.. 所以还是暂时先认份吧.唉. 06/23 22:52
15F:→ airderek:我看连博士级的人短时间也无解吧 06/23 22:53
16F:→ airderek:我是说有限的资料库下 如果无限的话 那根本就是无解 06/23 22:53
17F:→ cat771126:要是真能直接破解认证码,那会天下大乱 06/23 22:54
18F:→ airderek:破解的话 超多网站会被灌爆 举例 订票系统.为了抢票 06/23 22:55
19F:→ airderek:不择手段 如果破解後 那很多系统会挂点 06/23 22:56
20F:→ airderek:甚至被不当使用 程式狂订票 其实根本不是善意的.. 06/23 22:56