作者tonytonyjan (南洋大兜蟲)
看板CSSE
標題Re: [問題] OCR(光學辨識)推薦書籍或函式庫
時間Sat Nov 5 01:45:17 2011
我把我的問題貼在 Komica 得到的回覆貼在這裡與大家分享:
無名氏: 這應該偏影像辨識的學門了 之前是有玩face Detection (rpJRwjDA 11/11/03
07:12)
無名氏: 不過那是辨識人臉的 (rpJRwjDA 11/11/03 07:12)
無名氏: 文字辨識英文的話到還好,如果你要做中文的。我想你會做到死..........
(aOLUs/V6 11/11/03 10:36)
無名氏: 中文光是常用的字,少說有5千字....... (aOLUs/V6 11/11/03 10:37)
無名氏: 不然就是要找人家做好的來套用了 (aOLUs/V6 11/11/03 10:38)
無標題 名稱: 無名氏 [11/11/03(四)01:01 ID:jIVsifTM] No.6783 推
雖然我對OCR不熟,不過這個東西的確就是你的方向。
類似的應該還有車牌辨識/CAPTCHA破解之類的。
提到CAPTCHA破解我倒記得有一個很有趣的例子,
使用JavaScript實作類神經網路來破驗證碼。
http://ejohn.org/blog/ocr-and-neural-nets-in-javascript/
或許你也可以從這方面下手。
無標題 名稱: 無名氏 [11/11/03(四)07:36 ID:OK9R6lHk] No.6784 推
http://www.google.com/insidesearch/searchbyimage.html
無標題 名稱: 無名氏 [11/11/03(四)16:56 ID:a.T6EASg] No.6786 推
Google image search 是 content based 沒錯,但是和原 PO 的需求不同吧?
※ 引述《tonytonyjan (南洋大兜蟲)》之銘言:
: 有鑑於在像 komica 這類的討論版或論壇
: 回覆時都夾帶圖片,而圖片上常常會有字幕或者是漫畫角色的台詞,笑果十足
: 但是要蒐集這些東西其實很累,於是我有個 idea:
: 我打算實做一個 content based image search engine
: 對圖片上的文字,經過辨識之後做 indexing
: 如此只要把想要的話輸入進去,就可以找到任何相關動漫或電影台詞的引用圖片
: (我 google 老半天發現這世界好像還沒有這樣的搜尋引擎,讓我更想做了)
: 我有IR背景知識,但對於圖形辨識完全不得其門而入
: 希望在圖形辨識上有經驗的人可以給我一些指引
: 我目前試過 tesseract, gocr
: 不過經過測試我發現他們似乎主力在「文件」,對於卡通圖片中的文字辨識能力薄弱
: 問題:
: 1. 對於我的需求,我要找得技術是 OCR 沒錯吧?或者我弄錯關鍵字了?
: 2. 如果關鍵字確實是 OCR,是否有其他適合辨識圖畫(非文件)的函式庫?
: 3. 接續 2,有什麼推薦的書籍,可以學習如何實做一個 OCR system 呢?
: 感激不盡^_^
: PS.
: 這是自娛專案,有興趣參與的人也可來信 XD
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.246.1