作者tonytonyjan (南洋大兜虫)
看板CSSE
标题[问题] OCR(光学辨识)推荐书籍或函式库
时间Wed Nov 2 22:21:14 2011
有监於在像 komica 这类的讨论版或论坛
回覆时都夹带图片,而图片上常常会有字幕或者是漫画角色的台词,笑果十足
但是要蒐集这些东西其实很累,於是我有个 idea:
我打算实做一个 content based image search engine
对图片上的文字,经过辨识之後做 indexing
如此只要把想要的话输入进去,就可以找到任何相关动漫或电影台词的引用图片
(我 google 老半天发现这世界好像还没有这样的搜寻引擎,让我更想做了)
我有IR背景知识,但对於图形辨识完全不得其门而入
希望在图形辨识上有经验的人可以给我一些指引
我目前试过 tesseract, gocr
不过经过测试我发现他们似乎主力在「文件」,对於卡通图片中的文字辨识能力薄弱
问题:
1. 对於我的需求,我要找得技术是 OCR 没错吧?或者我弄错关键字了?
2. 如果关键字确实是 OCR,是否有其他适合辨识图画(非文件)的函式库?
3. 接续 2,有什麽推荐的书籍,可以学习如何实做一个 OCR system 呢?
感激不尽^_^
PS.
这是自娱专案,有兴趣参与的人也可来信 XD
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.113.246.1
※ 编辑: tonytonyjan 来自: 140.113.246.1 (11/02 22:22)
1F:推 kewang:还蛮有趣的,要不要试试MODI这个library,不过要安装OFFICE 11/02 22:55
2F:→ tonytonyjan:但我要跑在 UN*X Server上耶,这样 MODI 没问题吗 11/02 23:01
3F:推 hilorrk:关键字:字幕辨识/撷取.. 11/03 01:03