ontologylearning(本体).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语义web中的本体学习 Ontology Learning for the Semantic Web 报告人:李 曼 中国人民大学信息学院 主要内容 研究背景 本体的学习 本体的评价 相关工作 未来的研究方向 1.研究背景 Berners-Lee在2000的XML大会上正式提出了语义web。 语义web是对当前web的扩展。语义web上的信息具有定义良好的含义,使得计算机之间以及人类能够更好的彼此合作。 1.研究背景 语义web采用多层次的表示框架,本体位于从文档描述到知识推理转折的层次,具有重要的地位。本体的构建是实现语义web的关键环节。 1.1 本体 Ontology是共享概念模型的明确的形式化规范说明。 “概念模型”:指Ontology是通过抽象出客观世界中一些现象的相关概念而得到的模型。 “明确”:指Ontology所使用的概念及概念的约束都有明确的定义。 “形式化”:指Ontology是计算机可读的(即能被计算机处理)。 “共享”:指Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集(即Ontology针对的是团体而非个体的共识)。 1.1 本体 Ontology的结构是一个五元组 O:= { C, R, Hc,rel,AO} C:概念; R:关系; Hc:概念层次,例如HC(C1,C2); rel:概念间的关系, 例如,rel(R)=(C1,C2); AO:用某种逻辑语言表示的一组本体公理。 1.2 本体的应用 语义web 1.2 本体的应用 问题 :XML在处理语义上存在两个问题 1同义词; 2一词多义 解决:引入本体 本体通过对概念和概念间关系的严格定义来确定概念的精确含义,表示共同认可的、可共享的知识。 对于本体来说,Author,Creator是同一个概念,而Doctor在大学和医院分别表示的是两个概念。因此,在语义web中,本体是解决语义层次上web信息共享和交换的基础。 1.2 本体的应用 自然语言理解 全面的理解自然语言需要整合大量的知识源。以本体形式表示的领域知识是深入理解文本的基础。目前在基于本体的信息抽取方面已有一些研究成果。 知识管理 知识管理主要是处理一个组织中知识的获取、维护和访问。其中,本体可以用于对无结构信息进行语义标注,从而使得信息的整合和访问更容易。 1.2 本体的应用 电子商务 在电子商务中,交易的自动化要求对商品进行形式化描述,因此,需要一个标准化的词汇表——本体。本体有助于对内容意义的精确、高效通信,同时促使系统的交互式操作、重用和共享等一系列的性能得以提高。 1.2 本体的应用 从上述应用可以看出,这些应用领域的一个共同需求是共享某个领域内的知识。而提供共享概念模型的明确的形式化规范说明正是本体的主要目标。所以,这些领域的许多难题都能够通过使用本体来解决。 1.3 本体的构建 手工:费时费力,容易出错 全自动:适用性不强 半自动:可行,其核心技术是本体的学习——利用知识发现技术从数据源中获取知识 2. 本体学习 2.1 本体学习周期 2.2 本体学习框架 2.3 数据的导入和处理技术 2.4 本体学习算法 2. 本体学习 2.1 本体学习周期 2.2 本体学习框架 2.3 数据的导入和处理技术 2.4 本体学习算法 2.1 本体学习周期 (导入/重用、抽取、修剪和精练) 2.1 本体学习周期 导入和重用阶段 该阶段可以作为整个本体学习过程的开始。主要步骤: 选择有关的本体,并定义导入策略。 例如,定义一个本体包装器(wrapper),支持从一种本体描述语言转换为另一种语言。 合并导入的概念结构,作为其它阶段的基础。 2.1 本体学习周期 抽取阶段 利用导入的本体,抽取出新的知识。在这个阶段,本体学习技术部分依赖于给定的本体部分,所以,当本体被修订过一次后又会引起新的抽取结果,这是一个反复增长的模型。 2.1 本体学习周期 修剪阶段 本体结构的修剪可以使本体适应给定的应用。 该阶段需要考虑两个方面: 对本体中某个特殊部分的修剪将如何影响整个本体——用户驱动 保留或修剪本体元素的策略 ——应用驱动 2.1 本体学习周期 精练阶段 利用给定的领域本体,以更细的粒度完善本体 。 精练和抽取具有类似的功能。原则上,同样的算法既可以用于抽取也可以用于精练。抽取主

文档评论(0)

gjhn448 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档