- 8
- 0
- 约1.86万字
- 约 7页
- 2017-06-19 发布于河南
- 举报
脱机手写体汉字识别中细化特征提取和相似字识别算法研究
脱机手写体汉字识别中细化、特征提取和相似字识别算法研究
中文信息处理
汉字 象形文字 汉字的输入编码方案(拼音,五笔等) 人机交互
OCR系统有:TH—OCR、BI—OCR、SY—OCR
汉字识别能否通过市场这一严峻的考验,主要取决于两个重要因素:
识别方案是否具有较好的抗干扰能力,是否能适应实际应用环境中各种干扰噪声的影响,并保持较高的识别正确率,满足实际应用的要求
识别系统是否可以根据用户和市场的需求,不断及时地改进系统的性能指标和使用环境,从而在激烈的市场竞争中取得一席之地。
目前,印刷体汉字的识别率已经达到了99%以上,联机手写体汉字的识别率已经达到了99%,但是脱机手写体汉字的识别率较低,还不能满足社会的迫切需求
目前的脱机手写体汉字识别系统存在的主要问题有:
识别结果受图像质量影响较大
预处理和后处理在系统中的作用还需要不断加强
对于自由书写汉字的识别仍然不能令人满意
提取的特征区分能力较弱,难以适应不同字型的变换
典型的脱机手写体汉字识别系统由前段数字化输入装置、预处理系统、识别系统和后处理系统四大部分组成
进行脱机手写体汉字识别时,首先用输入装置将写在介质上的原始文本通过光电扫描仪等输入设备转换成二维图像信号(可以是灰度图像或二值图像):然后进行行、字切分,将整页版面的原始图像先按书写行分割开后从每行中切分出单个汉字图像,送入单字识别部分进行处
原创力文档

文档评论(0)