作者dpFish ()
看板HOT_Game
标题[讨论] 认证图集中解码
时间Sun Jun 24 00:33:23 2007
因为被 ban 很久了,
所以也无法真正上战场感受一下现在认证图到底改成怎样.. @@
不过看了一下板上的讨论串後,
大致归纳如下:
现在认证图即使可能是用一定规则生成的,(前景 + 背景?)
但总数量太多,照原先建资料库的方式的话
流量太大 server 会负荷不了;
又想要写出图片自动辨识的程式的话,
技术层级高到几乎遥不可及。
我有个不知道可不可行的想法:
在推广版的程式(例如α系列)中设定
每遇到认证图的话就将整张图片档传到一个 server 上,
然後写个简单的 PHP 介面,
让闲闲没事做的人来此疯狂解码,
(有心一点的话可以设计成紧张刺激的打字游戏)
然後再将解答传回推广版程式的用户端。
几个执行要点是:
1. 不要再建立图片资料库,
因为数量太多资料库传递困难。
如果图片的重复率还有一定的水准的话
可以考虑仅将资料库建立在 server 端就好,
当推广版程式将图片传回此 server 时先行比对资料库,
如果已有答案就直接回传不要送入打字游戏。
2. 推广版程式端不要再略过图片,
将认证图传到 server 後等待至有答案传回再送出到 click^3 网页,
或许可以减少被 ban 的风险?
会有此想法主要因为很多人还是想要挂着自动点击程式就不理它了,
尤其是睡觉或外出的时候,
但同样的也会又另一群人闲闲没事可以一直手动输入认证图,
但每认证通过一次後点几百下要几分钟的时间都浪费掉了,
我猜测应该会有足够的人力来完成集中解码的工作。
另外,这个方法最担心的应该还是
最重要的那台 server 撑不撑的住的问题,
我想其实一个认证码的小图不过几 KB(?),(被 ban 看不到 ><)
比起几个 MB 的「爱台湾.txt」应该算是还好的,
或许可请高手稍微仔细的估计一下流量,
如果觉得可行的话再进一步的实行。
(而回传的认证码只有 3~5 个位元组应该是不成问题。)
又推广版程式端亦可将认证图以更高的压缩率
(JPEG 的压缩率或 GIF 的颜色数)
进一步压缩後再传上 server ,
可以再减少些流量,
但前提是更高的压缩率不可到妨碍判读的地步,
只是现在很多图都已经很难判读了,
再压缩可能会更糟,
因此这方面的成效可能有限。
不好意思光说不练说了一大堆,
如果有热心的程式强者看到的话可以提供给你们参考一下,
如果没有就当作我整篇在废话吧...... @@"
谢谢大家看完。 :)
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.112.243.130
1F:推 jhjhs33504:压缩hash会一样吗? 06/24 00:34
2F:推 willy418:刚刚算了一下 如果只有1组组合 最少有40万笔资料= = 06/24 00:34
3F:→ ruo01332000:原图已经像被狗咬过的...在压缩的话...(默 06/24 00:34
4F:推 melting:这样做那台server真的很操.... 06/24 00:35
5F:推 LPH66:总觉得和4010篇日本提出的方法有异曲同工之妙 XD 06/24 00:36
6F:→ moara:新碗糕会把看过的认证图都存到硬碟里 XD 06/24 00:36
7F:推 mezz:阿发在辨识的时候会比对taiwan.txt里的资料吗? 06/24 00:37
8F:推 louis925:说不定透过适当的图片修改,图片会更容易辨别呢.. 06/24 00:40
9F:推 cogito:这个概念很棒呀 可以充分利用人力 又节省大部分人的时间 06/24 01:07