作者caeru (星羽)
看板HOT_Game
标题[讨论] 关於认证图的解码...
时间Sat Jun 23 16:30:26 2007
首先来探讨一下 MD5
这玩意主要是利用杂凑演算法,将档案计算出一个接近UNICODE的方式
意味着,除非这两个档案一模一样,不然 MD5 码肯定不同。
而现在要使认证码失效的方式如下:
1. 官方大量增图,用程式跑个1,000,000张图,粗估10小时内即可完成。
2. 随机产生图片,利用线上某微妙软体及时制造图片出来,这样子资料库再多资料都
没用。
3. 随机改变图片像素,以某些数量的图片档为基底,如5000张,送出前改变其中一个
像素的数值,就会让图的MD5档跟原始档完全不同,也会让资料库的辨识失效。
上述三种简易的方式都可以轻松破坏现行资料库的稳定性。
要应对的方式也不是没有:
1. 人力、人力、哈士奇。
2. 图片相关性验证,使用相关系数来测试图片有多接近。藉由这种方式来辅助资料库
辨识图片。这是中阶方法。
3. 线上字元辨识(OCR),这是终极方法。现阶段就跟太空旅行难度差不多...
发展出来万用prototype台湾就出名了。
以上...
结论是:
大家手动认证吧= =a
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.134.32.95
1F:→ pichuanlin:人力、人力、哈士奇? 06/23 16:30
2F:推 willy69wu31:哈士奇? 06/23 16:31
3F:推 willyden:上山 上山 爱? 06/23 16:32
4F:推 MarcusWill:推5000组认证码一样的图,改个bit也可以变50万张 06/23 16:32
5F:推 victor740519:这问题有讨稐过,但推论是....官方灌下大量图,而不 06/23 16:32
6F:→ victor740519:是改像素 06/23 16:33
7F:推 WYchuang:目前看起来应该是大量增图?似乎阿发妻的辨识率有提高 .. 06/23 16:33
8F:推 Zenta:哈士奇? 06/23 16:34
9F:推 caeru:如果有夥伴建立某图的资料库,但是之後却又要手动打 06/23 16:34
10F:→ caeru:那就代表有可能改像素,毕竟这种程度的script不难写 06/23 16:35
11F:推 lwei781:打字偶尔会自动辨识 所以Ian 那边一定也是DB 06/23 16:35
12F:→ moara:你标题可以改[无用] XD 06/23 16:36
13F:→ htalent:夥伴有建立资料库,但现行架构下不会更新到你电脑上 06/23 16:37
14F:推 Zerocks:人力、人力、哈士奇? XDDDDDD 06/23 16:37
15F:→ htalent:那就代表有可能重复,只是因为我们没有同步db 06/23 16:37
16F:推 WYchuang:所以要先弄P2P吗?不过我有点怀疑P2P的稳定性 ... 06/23 16:37
17F:推 victor740519:这个量...一直上下传,流量会报表....除非sql..... 06/23 16:37
18F:推 addbear:图档是什麽格式呢?bmp或是jpg 06/23 16:38
19F:→ WYchuang:不然就是用一台server定期收集MD5+code,然後定期发布... 06/23 16:39
20F:推 victor740519:bmp 06/23 16:40
21F:推 vicamo:图是 jpg 啦 = = 06/23 16:42
22F:推 victor740519:= =a 那我按右键怎嚜抓到bmp? 06/23 16:43
23F:→ htalent:抓到BMP你该清理暂存了= = 06/23 16:45
24F:推 addbear:jpg的话,1的可能性最高,因为jpg要即时压缩主机会死 06/23 16:44
25F:推 victor740519:h大...为什麽? 这个我不懂 06/23 16:49
26F:推 kuarcis:3做出来 刚好为点点点建立好形象XDDDD 06/23 16:49
27F:推 lwei781:3 可以拿Turing 06/23 16:50
28F:推 caeru:做得出来的话作者就发了 0.0 06/23 16:50
29F:推 starshine:3真的是会改变世界XD 06/23 16:52
30F:推 addbear:3可以,但是受限jpg解编码的速度,少使用者环境是可行的 06/23 16:52
31F:→ addbear:如果是bmp,三法都可行,但bandwidth可能出问题 06/23 16:55
32F:→ addbear:使用jpg,因jpg解编码要主机计算量,主机会够power 06/23 16:57
33F:推 alex7077:相关系数是不错的方法咧...不过实作和资料库有困难吧.>< 06/23 16:59
34F:推 caeru:编解码速度应该不是问题,decode一个JPG出色码绝对短於 06/23 16:58
35F:→ caeru:使用者RELOAD网页的速度,这样子时间就足够,只是没演算法 06/23 16:59
36F:→ caeru:可以用XD 06/23 17:00
37F:推 addbear:encoder的计算量远大於decoder 06/23 17:01
38F:→ addbear:除非对方是专研image process,知道部份解压缩的方法 06/23 17:03
39F:推 alex7077:相关系数法有人要试试吗...感觉很有feel.. 06/23 17:09
40F:推 caeru:de出来做比对就好了应该不用en回去吧 0.0 06/23 17:22