HC-05-DigitalPen_Paper第五讲基于笔的交互界面技术_.ppt

下载文档 降价啦

32
0
约1.68万字
约 170页
2017-09-10 发布于重庆
举报
版权申诉
保障服务

HC-05-DigitalPen_Paper第五讲基于笔的交互界面技术_.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

相关因素训练/测试集合大小 #Samples per Category [下页表格：#PC] #Samples per Writer [下页表格：#PW] 测试集中待识别汉字个数(类别数) 测试集合数据类型楷体Regular 行书Fluent 草书Cursive 汇总表格说明说明 1990年以来的文献结果测试类别数不少于1000 没有使用语言模型处理不能光看识别率高低没有给出商业系统的测试结果方法分类统计结构 HMM 混合基本观察——方法之争结构方法 PK 统计方法各有胜负，争论不休统计方法精度可以很高，但模型数据库很大 Velek等人的系统，模型数据库达30MB 结构方法识别性能可以差不多高，但模型数据小得多 Akiyama等人系统，模型数据库仅166KB 混合方法总体性能针对楷书最好结果：98% 针对行书/行楷最好结果：90%左右加入上下文处理最好结果?95%左右总体目标?99%（行书??自由书写？）距离目标多远：98%（不包括上下文）还有3个百分点的Gap — Research Opportunities 提纲概况系统流程技术介绍汉字模式表示汉字分类模型学习与适应上下文处理性能评估发展趋势发展趋势目标 Totally free writing：草书？需要新的表示与分类范式！汉字表示方面结构/统计各有所长/短混合模型统计基元模型笔划/子笔划的PDF 发展趋势分类器设计方法多分类器融合融合策略并行融合瀑布级联方法简单分类器作粗分类/预过滤复杂分类器区分相似字符加速，提高分类精度发展趋势模型学习与适应大规模的学习集合有望提高性能 Math is king, data is queen! 结构模型的自动构建需要深入研究结构参数的判别学习预期可以提高性能尚未有广泛研究采用发展趋势上下文处理布局分析/文字线检测分割/识别联动机制书写风格一致性同一书写人不同字符之间的风格一致性对书写人无关系统尤其重要不同人，同样的形状?不同的类别 End * * * 示例一 | 一一一 | 、一汉字原型笔划序列输入模式笔划序列一 | 一输入模式笔划序列一 | 一一输入模式笔划序列、动态规划(DP)匹配方法 DP匹配属成熟技术，但其性能依赖于基元选择采样点，小笔段，笔划，字根点序列的DP匹配也称为动态时间规正(Dynamic time warping) 基元之间距离度量 0/1？概率？笔划顺序变化多个Prototype？ 2. 笔划对应任务输入模式与字符原型匹配距离计算方法首先做笔划对应?笔划距离之和笔划对应也可以采用DP完成一 | 一一一 | 、一汉字原型笔划序列输入模式笔划序列 D = d1 + d2 + d3 + d4 + d5 + d6 + d7 + d8 + d9 3. 关系匹配Relational Matching 任务关系表示的匹配 ? 图匹配问题形式化在关系（relationship）约束下搜索两个集合中的元素之间的对应关系问题求解可以被形式化为“一致标定(consistent labeling)”问题，通过人工智能中的启发式搜索(heuristic search)或者松弛标定等方法解决松弛标定(Relaxation Labeling)计算效率高而启发式搜索则更灵活，可以很容易的结合不同的知识源和约束条件关系匹配属性关系图ARG的匹配 A*搜索算法松弛标定应用于字符识别或者字根检测优点笔划顺序无关——DP是笔划相关的关系约束提高了匹配精度——笔划对应不考虑笔划之间的关系缺点计算效率低于DP和笔划对应等 x T T T T L L L x 4. 基于知识的匹配含义利用汉字结构和书写方式的先验知识作为启发信息或者作为约束，用以减少搜索知识结构知识：上下，左右，内外预先指定（字根/单字）笔顺、笔划数的允许变化范围笔划顺序的统计比如某个笔划之后很少出现另外一个笔划之类优点知识规则的有效利用可以减少搜索有利于区分相似的字符，从而提高精度缺点知识库的建立和组织并不容易而且费时细分类方法结构匹配法 Structural matching 对应：结构表示概率匹配法 Probabilistic matching 对应：统计结构表示统计分类法 Statistical classification 对应：统计表示法概率匹配对应于统计-结构表示法简单属性?属性概率模型(容忍基元/关系差异) 距离/相似度计算笔划原型建模为(高斯)概率密度函数形成笔划类型概率表输入模式 – 字符模型之