作者tonytonyjan (南洋大兜虫)
看板CSSE
标题Re: [问题] OCR(光学辨识)推荐书籍或函式库
时间Wed Nov 9 00:46:11 2011
感谢你导正了我一个重要的观念
因为我一直以为 OCR 其实包含了 text detection
既然已经知道了关键字,就容易多了
我也确实在 google scholar 找到很多我需要的论文
万分的感谢,你帮我省下了很多时间= )
m(_ _)m
---编辑---
我後来在 stack overflow 找到这个帖子
http://stackoverflow.com/questions/880438/text-detection-location-libraries
和我的问题很像,回答中也意外找到了一个开源软体:
https://sourceforge.net/projects/tirg/
意外符合我要的东西啊XD
※ 引述《vgod (single)》之铭言:
: 这问题要拆成两部分来看, 第一是text detection, 在任意图上找出文字的位置
: 第二是text recognition, 给定图和文字区块的位置, 输出文字字串
: 第一个问题有很多种演算法, 要看你图的性质而决定要用哪种
: 如果能知道文字的位置後, 接下来其实就比较简单,
: 因为第二个问题可以直接用现成的OCR引擎加上一些image processing来处理
: 最容易取得的OCR引擎是Tesseract, 3.0後还支援包含中文在内的多国语言
: 但如你所说, OCR引擎大多是假设图片是白底黑字的文件
: 所以直接把有复杂背景的图片丢进去是不行的
: 最简单的处理方法就是用一些影像处理的演算法把背景去掉, 然後转成白底黑字的样子
: 这样再丢进OCR引擎的结果就会好很多
: 基本概念是这样, 关键字也都在上面了,
: 如果能看英文论文的话, 在google scholar能找到非常多资料
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.113.246.1
※ 编辑: tonytonyjan 来自: 140.113.246.1 (11/09 02:04)