作者Encrypt (Encrypt)
看板PhD
标题Re: [问题] 有没有和我一样在做[中文字识别]的苦命 …
时间Tue Feb 14 14:26:18 2006
: ※ 引述《vincientlin (vincient)》之铭言:
: : 我现在研究的领域是中文字识别
: : 他是属於pattern recognition技术上的应用
: : 要辨识中文字一般要先作image preprocessing
: : 通常会先将影像进行细线化 ==> 接着再抽取笔划
: : 我在pattern recognition和pattern recognition letter等期刊上
: : 找paper研究image thinning 和stroke extraction的研算法就花了很多时间
: : 先前paper的中文字影像细线化和抽取笔划的研算法上百种,前人做过的东西通常要实际
或许不要一直钻牛角尖,文字辨识不一定要抽取笔划
笔画和笔画的交叉点、笔画总长、tree的leave node个数也是特徵
你可以反向思考,不用硬去抽取复杂字体的笔画
可是改用简单的部首回过头去比对字体
有点像仓颉,看看他符合几种部首,再把可能性列出来
再从这里面的可能性之中藉由少许的特徵把字「猜」出来...
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.123.219.22