领域本体概念模型.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
领域本体概念模型

基于本体的语义标注(2) 一般来说,基于本体的语义标注需要经过以下步骤: 标注对象的导入及解析 提取文档中的本体概念 标注文档中的实例和抽取 假设“张三”是大学:教授的实例,我们可以先定位到短语“张三”,然后在它的前后加上这样的标签University:Professor和/University:Professor ,这样我们就把“张三”标注为Univesity:Porefssor的实例了。 基于词法-句法模式的实例提取方法 概念实例模式 一个或多个相同概念的实例可能被一些特殊的词联接起来,这些词可能是“或其他,例如,尤其是,是,……” 大提琴,中提琴,小提琴,或其它弦乐器; 股票市场特别是纳斯达克; 张三是学生; 王乔是校长 并列模式 很多实例也出现在一些并列句中,并且这些实例被一些如“或,和,…”之类的单词或者仅仅是“,”隔开 张三,李四和王五; 6.3.4 语义匹配 语义向量空间模型 在语义向量空间模型中,用语义向量来代表一篇文档,则该向量的每一维都对应一个概念空间的概念实例,每一个概念实例都对应一个属性向量空间的向量,这样每一个语义向量的都是由双重的向量来表示,在传统向量表示方法基础上扩充了每一维的语义表示。 语义相似度的计算 概念相似度 属性相似度 基于语义向量空间模型的匹配方法 构造查询向量 基于语义查询扩展 构造文档向量 基于文本语义标注 计算查询向量和文档向量之间的相似性 一个基于语义相似度的匹配算法 Part-of Instance-of Attribute-of 领域本体的构建 在领域本体构建方面,为大家所熟知的是斯坦福大学医学院提出的七步法。这七个步骤可概括为: 本体所属领域的确定; 对已有本体进行复用; 本体重要概念的识别; 类及类之间关系的确定; 类的属性的定义; 定义属性的约束; 实例的创建。 领域本体概念模型 图中只画出了本体模型中的概念,概念的属性和实例等在图中没有画出。 某旅游本体 本体描述语言 OWL 2003 年7 月W3C 公布了OWL Web Ontology 语言的最初工作草案,2004 年2 月10 日,OWL 正式成为W3C 推荐的标准。 OWL的语法和描述结构与RDFS相同,不同就在于OWL拥有更丰富的描述词汇(关键词)。 本体开发工具 本体构建 Protégé 由斯坦福大学基于Java平台开发的本体构建和编辑系统。 本体推理 Jena2 惠普公司基于java平台开发的用于处理半结构化数据的开源工具包,它的当前的版本是Jena2。 Protégé的主界面 某旅游本体在protégé 中的类图 利用protégé创建旅游本体后,可以保存为OWL语言编码的XML文件: owl:Class rdf:ID=sight owl:equivalentClass rdf:resource=#sight_spot/ rdfs:subClassOf rdf:resource=#tourist_resources/ rdfs:comment rdf:datatype=xsd;string景观/rdfs:comment /owl:Class owl:Class rdf:ID=modern_civilization owl:equivalentClass rdf:resource=#现代文明/ rdfs:subClassOf rdf:resource=#sight/ rdfs:comment rdf:datatype=xsd;string现代文明/rdfs:comment /owl:Class owl:Class rdf:ID=humanity_history owl:equivalentClass rdf:resource=#人文历史/ rdfs:subClassOf rdf:resource=#sight/ rdfs:comment rdf:datatype=xsd;string人文历史/rdfs:comment /owl:Class owl:Class rdf:ID=museum rdfs:subClassOf rdf:resource=# humanity_history / rdfs:comment rdf:datatype=xsd;string博物馆/rdfs:comment /owl:Class … … 8.2.4 语义网架构 (1)Unicode 与 URI Unicode 提供了一种对多语种纯文本进行一致编码的方法,便于国际文本文件的交换,其为每个字符提供了一个唯一的标识。 Unicode 标准已经被工业界所采用,目前很多最新的标准和操作系统以及最新的浏览器都要支持Unicode,这就为语义

您可能关注的文档

文档评论(0)

yanchuh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档