- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于特征提取的仿射变换系数自动获取 获取流程 兴趣点或角点检测:SIFT空间极值点检测往往会丢失掉重要的关键点,比如角点和拐点,而角点和拐点是计算仿射变换系数最重要的参数。通过对各种兴趣点和角点算法的比较,如Harris角点检测,Susan角点检测,采用强角点检测汉字图像的角点,具有稳定性好,检测到的角点准确而全面等优点。 角点描述子生成:检测到汉字角点以后,用改进的SIFT描述子生成角点特征向量,去除SIFT描述子的旋转不变性,提取位置和尺度不变量。 确定匹配点对:角点特征向量生成后,采用角点特征向量的欧氏距离作为两幅图像中角点的相似性判定度量。取图像一中的某个角点,并找出其与图像二中欧氏距离最近的前两个角点,这样就找到了基元图像中某个角点在汉字图像中相匹配的两个角点,从而不漏掉重要的相匹配的角点。 随机选取不共线的相匹配三对点可以计算确定一组仿射变换系数,通过使用前面介绍的归一化相关系数作为相似性度量,由此可以确定一组最佳的仿射变换系数。 汉字知识组织与表示 语义网络是通过概念及其语义关系来表达知识的一种有向网络图。 汉字集先按汉字一级结构聚类,构成语义网络的第一层次。 图2 汉字一级结构语义网络 汉字集 上下 左右 上 中 下 左 中右 全包围 上 三 包围 下三包围 左三包围 右上包围 左上 包围 左下 包围 横四 纵四 纵五 品字 架嵌 整体 汉字知识组织与表示 在一级结构的基础上,汉字的结构或基元再按照自上而下的语义关系汇集,构成一个多层次的语义网络。 图3 左三包围结构汉字语义网络 研究基础 分别对GB2312-80和GB18030-2000汉字字符集进行了编码和造字,提取和归纳了汉字基元和汉字结构。 搭建了无字库智能造字实验平台。 发表相关论文和专著六篇。 进度计划 ? 起止时间 工作内容 备注 2008/12-2009/01 研究原型匹配的认知模式识别理论 撰写论文一篇 2009/02-2009/03 研究整理仿射变换系数自动获取方法 撰写论文三篇 2009/03-2009/06 GB18030-2005剩余的四万多汉字编码 撰写论文一篇 2009/06-2009/08 GB18030-2005剩余的四万多汉字造字实验 撰写论文一篇 2009/08-2009/10 研究知识的组织和表示 撰写论文三篇 2009/10-2009/11 更大字符集的汉字编码 2009/11-2009/12 更大字符集的汉字造字实验 撰写论文一篇 2009/12-2010/04 撰写毕业论文 谢谢! 请各位老师和同学提出宝贵修改和完善意见和建议! 博士学位论文开题报告 认知模式识别理论及其在无字库智能造字应用研究 研 究 生:刘明友 指导教师:皮佑国 教授 Outline 背景 研究内容和创新点 研究基础 进度计划 背景—模式识别 模式识别尚存在两个主要问题需要解决: 小样本问题 迄今为止的模式识别主要是基于被识别事物的区分机理,而不是基于认知机理,在“识”方面,即对事物认识(学习)方面与人类的认知过程差异较大而且学习能力不足 背景—智能造字 字库方式存在的弊端: 难于形成规模适度和长期稳定的汉字信息化标准 不符合汉字的造字规律,无法传承汉字文化 不符合汉字认知规律,与汉字教学脱节 不能满足整个社会的应用需求 信息熵高,是效率最低语言文字信息系统之一 研究内容和创新点 提出了基于原型匹配的认知模式识别理论 提出了拟人的计算机无字库智能造字 完善了汉字原型及结构提取理论和方法 提出了汉字基元映射知识获取方法 提出了汉字知识组织与表示方法 原型匹配的认知模式识别理论研究 恒常性与拓扑不变性 模式的组成 原型与成分的关系 恒常性与拓扑不变性 视知觉恒常性表述为:在对象图像信息足够确定其模式的条件下,图像的大小变化和形状变化不影响人对对象的知觉。用几何拓扑学的相关理论,建立物体对象的数学模型,从大小和形状恒常性两个角度加以证明。 模式的组成 从成分识别理论出发,研究现实世界中物体的组成法则。比如,世界上的物质种类多得数不清,但组成物质的化学元素却只有一百多种。又如,可以通过红、绿、蓝三种颜色来构成五彩缤纷的颜色。Biederman的成分识别理论揭示了客观世界的构成模式:客观世界中的所有物体都是由一些成分构成的,也就是说,客观世界中物体都可以分解成一定的组成成分,各个成分之间的组合关系我们称之为结构。我们用集合理论来对物体的构建进行描述。 原型与成分的关系 原型是这一类客体所有的个体的概括表征。物体是由一些成分按照其结构所组成的,这里的成分是具体的、确定的。因此原型和组成物体的成分之间就存在一个由概括到确定,由抽象到具体的过程。我们用拓扑空间相关理论,研究原型与具体的组成成分之间的拓扑映射。 从拓扑学的理论加以
文档评论(0)