基于多值词汇语义相似度的SME模型改进.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
绪论 绪论 认知科学对人类学习机制的研究表明,学习的过程是利用旧知识获取新知识的过 程。典型的成果有 Ausubel 提出的有意义学习理论(又称同化理论)[1],其核心思想是 获得新知识主要取决于认知结构中已有的相似知识。意义学习是通过新知识与学习者认 知结构中已有的概念相互作用才得以发生,由于这种相互作用的结果,导致了新旧知识 意义的同化。而类比推理就是一种通过旧知识来学习新知识的过程。类比推理是指从两 个类的相似性和一个类的已知特征推出另一个类也具有这个特征的过程。 1.1 课题的选题背景及意义 SME 模型是类比推理模型中比较核心的模型之一,它为类比推理模型的发展奠定 了基础,但同时它也存在一些问题。问题之一[2-7],在进行类比时,需要给出已知知识 结构和新知识部分知识结构。在 SME 模型中需要人为的从数据源中找出对象,对象与 对象之间的关系,并将它们连结在一起,形成一个类树状结构,也即知识结构。在计算 机和网络技术越来越发达的情况下,越来越多的数据源从文本型转换为关系型。在数据 源为关系型数据时,SME 人为从关系型数据源中提取知识结构,提取过程比较麻烦。 在提取过程中,涉及计算时,如果出现人为的计算错误,还可能使得提取结构不准确。 总而言之,SME 类比推理模型中人为的从关系型数据源提取领域知识结构,可能会出 现提取过程麻烦,提取结构不准确的问题。 问题之二[5-11,13-15],SME 类比推理模型,在计算概念语义相似度时,需要人为的给 出,并且给出的相似度值为二值,即 0 或者 1。SME 在计算对象和关系相似度值时,只 考虑关系的相似度,而不考虑对象的相似度。如果在源知识也即已知知识中,出现两个 源知识关系都与新知识关系全部相似,对象全都不相似,并且它们的结构都与新知识结 构相似的情况下,就不能确定哪个源知识作为最后的结果,最后产生的结果相对来说可 能不是最好的,即产生的类比用例不能更好的帮助学习者学习新知识。例如,新知识为: 行星绕着太阳转,两源知识分别为月亮绕着地球转和电子绕着原子核转。新知识和两个 源知识关系都为绕着转,他们的相似度为 1,结构也是相同的,它们都有可能作为最后 的结果。但是我们在学习的过成中,源知识月亮绕着地球转比源知识电子绕着原子核转 1 基于多值词汇语义相似度的 SME 模型改进 能更好的帮助学习者学习新知识行星绕着太阳转。综上所述,在某种情况下,SME 模 型产生的结果相对来说可能不是最好的,更有甚者不能产生类比用例。 本论文针对上述两个问题,进行详细的探讨和分析,提出相应的解决办法。 1.2 国内外研究现状 类比推理是一种归纳推理的思考,在日常生活中常不知不觉的使用类比来学习新事 物或解释抽象的科学概念[4,5]。类比推理作为一种新的问题求解机制,在领域知识不完 备时,此时无法用演绎推理解决新问题,而使用类比推理就能将相似问题中的知识和求 解方法引入新问题中以填补缺少的知识,从而求解新问题。类比推理是一种重要的知识 获取机制。有了类比推理后,只需记忆已知情况的处理方法,类比推理就能自动学习已 知情况的知识,生成关于新情况的知识。下面我们介绍几个比较有代表性的类比推理模 型。 1.2.1 类比推理模型研究现状 在类比推理模型的研究方面,Gentner 提出的结构映射理论[2,3,5,6](SMT,Structure Mapping Theory)以知识结构的相似性刻画了类比机制,SMT 理论只要是以结构相似性 为主,并且认为类比推理的关键是建立源知识与靶知识之间的映射。源知识表示已知知 识,靶知识表示新知识。结构映射理论中,源、靶是概念和关系的集合,其元素之间具 有一定的关系。SMT 理论随后由 Ken Forbus 等发展为一种计算模型,即结构映射引擎 (SME)[2,3,7-17]。作为 SMT 理论的仿真,SME 应用于人类类比推理的几个方面。SME 作为映射工具,后来又提出它的检索工具 MAC/FAC[5,18],在 MAC/FAC 阶段,加入了 语义相似性因素。SME 的纯结构方法加上 MAC/FAC 语义相似性因素保持了她在这一 领域中奠基人地位。但同时 SME 存在几方面的不足[6,9,19-23],一是 SME 找最佳匹配时, 要对所有的匹配都进行计算,计算量比较大;二是在进行词汇相似度计算时,计算值为 0 或者 1,并且需要人为的给出;三是领域知识结构需要人为的给出。李波等人提出了 一套基本完整的类比推理理论,并实现了类比推理系统 BHARS[24-26],取得了令人满意 的结果。该系统将类比推理分为联想、求精、匹配和转换四个过程。该模型对 SME 模 型进行了修改,能够自动寻找概念之间的相似,而不是需要用户指定相似性情况。 BHARS 采用了基于突出特征的类

文档评论(0)

lh2468lh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档