作者seagal (基因寶寶)
看板C_Sharp
標題Re: 挑選重複圖片的演算法
時間Thu Jan 8 22:37:48 2004
※ 引述《tomex (tomex)》之銘言:
: 很多人有收集美女圖的經驗吧! 有隻程式「圖片清潔工」就可比對重複的圖,
: 讓你預覽之後再決定是否刪除!
: 不過,資訊過量的時代裏,希望能直接刪除或比對後做一些事情
: 最好的方式就是直接比對檔案大小(雖有誤差但可接受)
: 更精準的是辨識圖檔的格式加以讀取(不過這樣工程/效率太浩大了)
: 單就比對檔案大小,程式很簡單,假設n張圖裏有x對重複圖
: 最笨的big-o就是 n*n次!
: 我常在想,有否更好的演算法,因為看到硬碟一直閃
: 實有心中不忍!
: 聽說有個矩陣比對的方式更快,但我不會!
: 我目前想到的是比較簡單的,先使用快速排序大小,再刪重複檔
: 這樣的big-o是 n*x,大大地減少很多!
: 你有其他的想法嗎?
用hash去存
key => file大小, value => 出現次數
BigO => n
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.109.73.177