- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
相关因素 训练/测试集合大小 #Samples per Category [下页表格:#PC] #Samples per Writer [下页表格:#PW] 测试集中待识别汉字个数(类别数) 测试集合数据类型 楷体Regular 行书Fluent 草书Cursive 汇总表格说明 说明 1990年以来的文献结果 测试类别数不少于1000 没有使用语言模型处理 不能光看识别率高低 没有给出商业系统的测试结果 方法分类 统计 结构 HMM 混合 基本观察——方法之争 结构方法 PK 统计方法 各有胜负,争论不休 统计方法 精度可以很高,但模型数据库很大 Velek等人的系统,模型数据库达30MB 结构方法 识别性能可以差不多高,但模型数据小得多 Akiyama等人系统,模型数据库仅166KB 混合方法 总体性能 针对楷书 最好结果:98% 针对行书/行楷 最好结果:90%左右 加入上下文处理 最好结果?95%左右 总体目标?99%(行书??自由书写?) 距离目标多远:98%(不包括上下文) 还有3个百分点的Gap — Research Opportunities 提纲 概况 系统流程 技术介绍 汉字模式表示 汉字分类 模型学习与适应 上下文处理 性能评估 发展趋势 发展趋势 目标 Totally free writing:草书? 需要新的表示与分类范式! 汉字表示方面 结构/统计各有所长/短 混合模型 统计基元模型 笔划/子笔划的PDF 发展趋势 分类器设计方法 多分类器融合 融合策略 并行融合 瀑布级联方法 简单分类器作粗分类/预过滤 复杂分类器区分相似字符 加速,提高分类精度 发展趋势 模型学习与适应 大规模的学习集合有望提高性能 Math is king, data is queen! 结构模型的自动构建需要深入研究 结构参数的判别学习预期可以提高性能 尚未有广泛研究采用 发展趋势 上下文处理 布局分析/文字线检测 分割/识别联动机制 书写风格一致性 同一书写人不同字符之间的风格一致性 对书写人无关系统尤其重要 不同人,同样的形状?不同的类别 End * * * 示例 一 | 一 一 一 | 、 一 汉字原型笔划序列 输入模式笔划序列 一 | 一 输入模式笔划序列 一 | 一 一 输入模式笔划序列 、 动态规划(DP)匹配方法 DP匹配属成熟技术,但其性能依赖于 基元选择 采样点,小笔段,笔划,字根 点序列的DP匹配也称为动态时间规正(Dynamic time warping) 基元之间距离度量 0/1?概率? 笔划顺序变化 多个Prototype? 2. 笔划对应 任务 输入模式与字符原型匹配距离计算 方法 首先做笔划对应?笔划距离之和 笔划对应也可以采用DP完成 一 | 一 一 一 | 、 一 汉字原型笔划序列 输入模式笔划序列 D = d1 + d2 + d3 + d4 + d5 + d6 + d7 + d8 + d9 3. 关系匹配Relational Matching 任务 关系表示的匹配 ? 图匹配问题 形式化 在关系(relationship)约束下搜索两个集合中的元素之间的对应关系 问题求解 可以被形式化为“一致标定(consistent labeling)”问题,通过人工智能中的启发式搜索(heuristic search)或者松弛标定等方法解决 松弛标定(Relaxation Labeling)计算效率高 而启发式搜索则更灵活,可以很容易的结合不同的知识源和约束条件 关系匹配 属性关系图ARG的匹配 A*搜索算法 松弛标定 应用于字符识别或者字根检测 优点 笔划顺序无关——DP是笔划相关的 关系约束提高了匹配精度——笔划对应不考虑笔划之间的关系 缺点 计算效率低于DP和笔划对应等 x T T T T L L L x 4. 基于知识的匹配 含义 利用汉字结构和书写方式的先验知识 作为启发信息或者作为约束,用以减少搜索 知识 结构知识:上下,左右,内外 预先指定(字根/单字)笔顺、笔划数的允许变化范围 笔划顺序的统计 比如某个笔划之后很少出现另外一个笔划之类 优点 知识规则的有效利用可以减少搜索 有利于区分相似的字符,从而提高精度 缺点 知识库的建立和组织并不容易而且费时 细分类方法 结构匹配法 Structural matching 对应:结构表示 概率匹配法 Probabilistic matching 对应:统计结构表示 统计分类法 Statistical classification 对应:统计表示法 概率匹配 对应于统计-结构表示法 简单属性?属性概率模型(容忍基元/关系差异) 距离/相似度计算 笔划原型建模为(高斯)概率密度函数 形成笔划类型概率表 输入模式 – 字符模型 之
文档评论(0)