作者caeru (星羽)
看板HOT_Game
標題[討論] 關於認證圖的解碼...
時間Sat Jun 23 16:30:26 2007
首先來探討一下 MD5
這玩意主要是利用雜湊演算法,將檔案計算出一個接近UNICODE的方式
意味著,除非這兩個檔案一模一樣,不然 MD5 碼肯定不同。
而現在要使認證碼失效的方式如下:
1. 官方大量增圖,用程式跑個1,000,000張圖,粗估10小時內即可完成。
2. 隨機產生圖片,利用線上某微妙軟體及時製造圖片出來,這樣子資料庫再多資料都
沒用。
3. 隨機改變圖片像素,以某些數量的圖片檔為基底,如5000張,送出前改變其中一個
像素的數值,就會讓圖的MD5檔跟原始檔完全不同,也會讓資料庫的辨識失效。
上述三種簡易的方式都可以輕鬆破壞現行資料庫的穩定性。
要應對的方式也不是沒有:
1. 人力、人力、哈士奇。
2. 圖片相關性驗證,使用相關系數來測試圖片有多接近。藉由這種方式來輔助資料庫
辨識圖片。這是中階方法。
3. 線上字元辨識(OCR),這是終極方法。現階段就跟太空旅行難度差不多...
發展出來萬用prototype台灣就出名了。
以上...
結論是:
大家手動認證吧= =a
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.134.32.95
1F:→ pichuanlin:人力、人力、哈士奇? 06/23 16:30
2F:推 willy69wu31:哈士奇? 06/23 16:31
3F:推 willyden:上山 上山 愛? 06/23 16:32
4F:推 MarcusWill:推5000組認證碼一樣的圖,改個bit也可以變50萬張 06/23 16:32
5F:推 victor740519:這問題有討稐過,但推論是....官方灌下大量圖,而不 06/23 16:32
6F:→ victor740519:是改像素 06/23 16:33
7F:推 WYchuang:目前看起來應該是大量增圖?似乎阿髮妻的辨識率有提高 .. 06/23 16:33
8F:推 Zenta:哈士奇? 06/23 16:34
9F:推 caeru:如果有夥伴建立某圖的資料庫,但是之後卻又要手動打 06/23 16:34
10F:→ caeru:那就代表有可能改像素,畢竟這種程度的script不難寫 06/23 16:35
11F:推 lwei781:打字偶爾會自動辨識 所以Ian 那邊一定也是DB 06/23 16:35
12F:→ moara:你標題可以改[無用] XD 06/23 16:36
13F:→ htalent:夥伴有建立資料庫,但現行架構下不會更新到你電腦上 06/23 16:37
14F:推 Zerocks:人力、人力、哈士奇? XDDDDDD 06/23 16:37
15F:→ htalent:那就代表有可能重複,只是因為我們沒有同步db 06/23 16:37
16F:推 WYchuang:所以要先弄P2P嗎?不過我有點懷疑P2P的穩定性 ... 06/23 16:37
17F:推 victor740519:這個量...一直上下傳,流量會報表....除非sql..... 06/23 16:37
18F:推 addbear:圖檔是什麼格式呢?bmp或是jpg 06/23 16:38
19F:→ WYchuang:不然就是用一台server定期收集MD5+code,然後定期發佈... 06/23 16:39
20F:推 victor740519:bmp 06/23 16:40
21F:推 vicamo:圖是 jpg 啦 = = 06/23 16:42
22F:推 victor740519:= =a 那我按右鍵怎嚜抓到bmp? 06/23 16:43
23F:→ htalent:抓到BMP你該清理暫存了= = 06/23 16:45
24F:推 addbear:jpg的話,1的可能性最高,因為jpg要即時壓縮主機會死 06/23 16:44
25F:推 victor740519:h大...為什麼? 這個我不懂 06/23 16:49
26F:推 kuarcis:3做出來 剛好為點點點建立好形象XDDDD 06/23 16:49
27F:推 lwei781:3 可以拿Turing 06/23 16:50
28F:推 caeru:做得出來的話作者就發了 0.0 06/23 16:50
29F:推 starshine:3真的是會改變世界XD 06/23 16:52
30F:推 addbear:3可以,但是受限jpg解編碼的速度,少使用者環境是可行的 06/23 16:52
31F:→ addbear:如果是bmp,三法都可行,但bandwidth可能出問題 06/23 16:55
32F:→ addbear:使用jpg,因jpg解編碼要主機計算量,主機會夠power 06/23 16:57
33F:推 alex7077:相關係數是不錯的方法咧...不過實作和資料庫有困難吧.>< 06/23 16:59
34F:推 caeru:編解碼速度應該不是問題,decode一個JPG出色碼絕對短於 06/23 16:58
35F:→ caeru:使用者RELOAD網頁的速度,這樣子時間就足夠,只是沒演算法 06/23 16:59
36F:→ caeru:可以用XD 06/23 17:00
37F:推 addbear:encoder的計算量遠大於decoder 06/23 17:01
38F:→ addbear:除非對方是專研image process,知道部份解壓縮的方法 06/23 17:03
39F:推 alex7077:相關係數法有人要試試嗎...感覺很有feel.. 06/23 17:09
40F:推 caeru:de出來做比對就好了應該不用en回去吧 0.0 06/23 17:22