作者airderek (此使用者離位)
看板HOT_Game
標題重貼 關於認證圖的解碼
時間Sat Jun 23 22:47:44 2007
※ 引述《caeru (星羽)》之銘言:
首先來探討一下 MD5
這玩意主要是利用雜湊演算法,將檔案計算出一個接近UNICODE的方式
意味著,除非這兩個檔案一模一樣,不然 MD5 碼肯定不同。
而現在要使認證碼失效的方式如下:
1. 官方大量增圖,用程式跑個1,000,000張圖,粗估10小時內即可完成。
2. 隨機產生圖片,利用線上某微妙軟體及時製造圖片出來,這樣子資料庫再多資料都
沒用。
3. 隨機改變圖片像素,以某些數量的圖片檔為基底,如5000張,送出前改變其中一個
像素的數值,就會讓圖的MD5檔跟原始檔完全不同,也會讓資料庫的辨識失效。
上述三種簡易的方式都可以輕鬆破壞現行資料庫的穩定性。
要應對的方式也不是沒有:
1. 人力、人力、哈士奇。
2. 圖片相關性驗證,使用相關系數來測試圖片有多接近。藉由這種方式來輔助資料庫
辨識圖片。這是中階方法。
3. 線上字元辨識(OCR),這是終極方法。現階段就跟太空旅行難度差不多...
發展出來萬用prototype台灣就出名了。
以上...
結論是:
手動認證是目前唯一方法
___________________________________________________________________________
我(airderek)補充:
數字相同 但是後面的 MD5未必相同...
請大家文章都盡量爬一爬再來想...
物以為已為字母一樣 但後面背景有點不同
依舊仍認為結果還是相同
有這麼好破 那麼雅虎即時通.. 不會採用這種認證....
除非辨識系統做出來...
要不然假使圖不斷出現新的..
那只會是個無底洞~
除非他是用有限資料庫做...
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.166.240.111
1F:推 jhjhs33504:OP 06/23 22:47
2F:→ airderek:我重貼=.= 因為有人不懂 ... 06/23 22:48
3F:→ airderek:那文章被淹沒了.. 06/23 22:48
4F:推 cat771126:目前根據dannyst大表示,官方是以一個比例在混合新舊圖 06/23 22:48
5F:→ cat771126:一張圖的存活時間很短,所以資料庫是沒用的 06/23 22:49
6F:→ airderek:怎樣的比例呢?....週期有猜到嗎?混合排列組合你能算出嗎? 06/23 22:49
7F:→ whogotme:就像拍101大樓 有很多角度的照片 但結果都是101大樓 06/23 22:49
8F:→ airderek:一張圖 是好幾層做的 ...說比例很籠統 給數據比較實際 06/23 22:49
9F:→ cat771126:這要問dannyst大了 06/23 22:50
10F:→ airderek:光新舊混合就可以把你搞死了 抽一種顏色 跟 新的字母混 06/23 22:51
11F:→ airderek:如果線條扭曲 又變化 旋轉角度 等等 06/23 22:51
12F:→ airderek:還有字母可能 可以加上不同腐蝕 每個動作的代表碼不同 06/23 22:51
13F:推 cat771126:目前可以確定的是,一直建立資料庫是沒用的 06/23 22:52
14F:→ airderek:MD5是很多控制變因組合的.. 所以還是暫時先認份吧.唉. 06/23 22:52
15F:→ airderek:我看連博士級的人短時間也無解吧 06/23 22:53
16F:→ airderek:我是說有限的資料庫下 如果無限的話 那根本就是無解 06/23 22:53
17F:→ cat771126:要是真能直接破解認證碼,那會天下大亂 06/23 22:54
18F:→ airderek:破解的話 超多網站會被灌爆 舉例 訂票系統.為了搶票 06/23 22:55
19F:→ airderek:不擇手段 如果破解後 那很多系統會掛點 06/23 22:56
20F:→ airderek:甚至被不當使用 程式狂訂票 其實根本不是善意的.. 06/23 22:56