- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
领域本体概念模型
基于本体的语义标注(2) 一般来说,基于本体的语义标注需要经过以下步骤: 标注对象的导入及解析 提取文档中的本体概念 标注文档中的实例和抽取 假设“张三”是大学:教授的实例,我们可以先定位到短语“张三”,然后在它的前后加上这样的标签University:Professor和/University:Professor ,这样我们就把“张三”标注为Univesity:Porefssor的实例了。 基于词法-句法模式的实例提取方法 概念实例模式 一个或多个相同概念的实例可能被一些特殊的词联接起来,这些词可能是“或其他,例如,尤其是,是,……” 大提琴,中提琴,小提琴,或其它弦乐器; 股票市场特别是纳斯达克; 张三是学生; 王乔是校长 并列模式 很多实例也出现在一些并列句中,并且这些实例被一些如“或,和,…”之类的单词或者仅仅是“,”隔开 张三,李四和王五; 6.3.4 语义匹配 语义向量空间模型 在语义向量空间模型中,用语义向量来代表一篇文档,则该向量的每一维都对应一个概念空间的概念实例,每一个概念实例都对应一个属性向量空间的向量,这样每一个语义向量的都是由双重的向量来表示,在传统向量表示方法基础上扩充了每一维的语义表示。 语义相似度的计算 概念相似度 属性相似度 基于语义向量空间模型的匹配方法 构造查询向量 基于语义查询扩展 构造文档向量 基于文本语义标注 计算查询向量和文档向量之间的相似性 一个基于语义相似度的匹配算法 Part-of Instance-of Attribute-of 领域本体的构建 在领域本体构建方面,为大家所熟知的是斯坦福大学医学院提出的七步法。这七个步骤可概括为: 本体所属领域的确定; 对已有本体进行复用; 本体重要概念的识别; 类及类之间关系的确定; 类的属性的定义; 定义属性的约束; 实例的创建。 领域本体概念模型 图中只画出了本体模型中的概念,概念的属性和实例等在图中没有画出。 某旅游本体 本体描述语言 OWL 2003 年7 月W3C 公布了OWL Web Ontology 语言的最初工作草案,2004 年2 月10 日,OWL 正式成为W3C 推荐的标准。 OWL的语法和描述结构与RDFS相同,不同就在于OWL拥有更丰富的描述词汇(关键词)。 本体开发工具 本体构建 Protégé 由斯坦福大学基于Java平台开发的本体构建和编辑系统。 本体推理 Jena2 惠普公司基于java平台开发的用于处理半结构化数据的开源工具包,它的当前的版本是Jena2。 Protégé的主界面 某旅游本体在protégé 中的类图 利用protégé创建旅游本体后,可以保存为OWL语言编码的XML文件: owl:Class rdf:ID=sight owl:equivalentClass rdf:resource=#sight_spot/ rdfs:subClassOf rdf:resource=#tourist_resources/ rdfs:comment rdf:datatype=xsd;string景观/rdfs:comment /owl:Class owl:Class rdf:ID=modern_civilization owl:equivalentClass rdf:resource=#现代文明/ rdfs:subClassOf rdf:resource=#sight/ rdfs:comment rdf:datatype=xsd;string现代文明/rdfs:comment /owl:Class owl:Class rdf:ID=humanity_history owl:equivalentClass rdf:resource=#人文历史/ rdfs:subClassOf rdf:resource=#sight/ rdfs:comment rdf:datatype=xsd;string人文历史/rdfs:comment /owl:Class owl:Class rdf:ID=museum rdfs:subClassOf rdf:resource=# humanity_history / rdfs:comment rdf:datatype=xsd;string博物馆/rdfs:comment /owl:Class … … 8.2.4 语义网架构 (1)Unicode 与 URI Unicode 提供了一种对多语种纯文本进行一致编码的方法,便于国际文本文件的交换,其为每个字符提供了一个唯一的标识。 Unicode 标准已经被工业界所采用,目前很多最新的标准和操作系统以及最新的浏览器都要支持Unicode,这就为语义
您可能关注的文档
- 蓝胶尤加利精油与茉莉花精油对五专女生登阶运动后心率恢复之影响 .doc
- 揽才须知 - 金属工业研究发展中心.doc
- 老人高血压的诊断与治疗 - 台湾家庭医学医学会.pdf
- 雷达截面测量数据处理方法的改进 - 易迪拓培训.pdf
- 类神经网路在公路边坡破坏潜能之评估.pdf
- 类新型三电平软开关dc.dc 变换器的研究.pdf
- 累积方向-数量级光流梯度直方图的人体动作识别 - 智能系统学报.pdf
- 离散信源的熵表示.ppt
- 离散型随机变量的概率分布 - ok.ppt
- 离网型海岛综合能源微电网架构设计与实现 - 电力工程技术.pdf
- 2024高考物理一轮复习规范演练7共点力的平衡含解析新人教版.doc
- 高中语文第5课苏轼词两首学案3新人教版必修4.doc
- 2024_2025学年高中英语课时分层作业9Unit3LifeinthefutureSectionⅢⅣ含解析新人教版必修5.doc
- 2024_2025学年新教材高中英语模块素养检测含解析译林版必修第一册.doc
- 2024_2025学年新教材高中英语单元综合检测5含解析外研版选择性必修第一册.doc
- 2024高考政治一轮复习第1单元生活与消费第三课多彩的消费练习含解析新人教版必修1.doc
- 2024_2025学年新教材高中英语WELCOMEUNITSectionⅡReadingandThi.doc
- 2024_2025学年高中历史专题九当今世界政治格局的多极化趋势测评含解析人民版必修1.docx
- 2024高考生物一轮复习第9单元生物与环境第29讲生态系统的结构和功能教案.docx
- 2024_2025学年新教材高中英语UNIT5LANGUAGESAROUNDTHEWORLDSect.doc
文档评论(0)