- 3
- 0
- 约1.13千字
- 约 28页
- 2017-01-02 发布于浙江
- 举报
杭州信雅达系统工程股份有限公司 季白杨 博士 Optical Character Recognition 字符识别的历程 概念的提出始于1929年 国内的研究从70年代才开始,目前已经达到国际先进水平,其中汉字工作识别技术已经位居国际领先 字符识别的类型 脱机 银行领域的应用 税务领域的应用 电子政务领域的应用 电子公文审批与流转 电子公文的识别与查询 OCR应用的技术组成 图像处理 版面理解 表格识别 字符分割 行分割 字分割 字符识别 字体识别 语义后处理 格式化输出 目前挑战性的课题 脱机手写汉字识别 超大字符集的印刷字符识别 非定制版面分析 OCR涉及的模式识别问题 一致性假设 在统计意义下,一般假设: 样本与分类对象具有同分布。 给定的所有分类对象独立同分布。 样本的分析 决策对样本空间划分的有效性。 推广能力:决策对分类对象的有效性。 贝叶斯决策理论 已知的先验概率 需要决策的类别数是一定的 基于模型的方法 人工神经网络 缺乏充分的理论基础 局部极小点问题 过学习与欠学习的问题 支持向量机 统计学习理论 一种专门研究小样本统计学习规律的理论 九十年代初取得重要进展 核技术 可以证明,一定存在一个映射,称为核函数,将在欧式空间定义的样本映射到特征空间(一个更高维的空间),使得在特征空间上,样本构成两个不相交的闭凸集。 研究核函数选择的技术称为核技术。 对比
原创力文档

文档评论(0)