作者tonytonyjan (南洋大兜蟲)
看板CSSE
標題Re: [問題] OCR(光學辨識)推薦書籍或函式庫
時間Wed Nov 9 00:46:11 2011
感謝你導正了我一個重要的觀念
因為我一直以為 OCR 其實包含了 text detection
既然已經知道了關鍵字,就容易多了
我也確實在 google scholar 找到很多我需要的論文
萬分的感謝,你幫我省下了很多時間= )
m(_ _)m
---編輯---
我後來在 stack overflow 找到這個帖子
http://stackoverflow.com/questions/880438/text-detection-location-libraries
和我的問題很像,回答中也意外找到了一個開源軟體:
https://sourceforge.net/projects/tirg/
意外符合我要的東西啊XD
※ 引述《vgod (single)》之銘言:
: 這問題要拆成兩部分來看, 第一是text detection, 在任意圖上找出文字的位置
: 第二是text recognition, 給定圖和文字區塊的位置, 輸出文字字串
: 第一個問題有很多種演算法, 要看你圖的性質而決定要用哪種
: 如果能知道文字的位置後, 接下來其實就比較簡單,
: 因為第二個問題可以直接用現成的OCR引擎加上一些image processing來處理
: 最容易取得的OCR引擎是Tesseract, 3.0後還支援包含中文在內的多國語言
: 但如你所說, OCR引擎大多是假設圖片是白底黑字的文件
: 所以直接把有複雜背景的圖片丟進去是不行的
: 最簡單的處理方法就是用一些影像處理的演算法把背景去掉, 然後轉成白底黑字的樣子
: 這樣再丟進OCR引擎的結果就會好很多
: 基本概念是這樣, 關鍵字也都在上面了,
: 如果能看英文論文的話, 在google scholar能找到非常多資料
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.246.1
※ 編輯: tonytonyjan 來自: 140.113.246.1 (11/09 02:04)