- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高级数据库技术知识库技术02(本体)分析
4.2.3 知识的本体表示 (3)都柏林核心元数据集(Dublin Core) 美国OCLC公司发起,国际性合作项目Dublin Core Metadata Initiative设计描述Web资源的元数据规范 主要用于出版信息描述也被用于描述其他领域信息 Dublin Core定义一组基本元素来描述资源的元数据 很多知识描述标准如RDF、DAML+OIL都有对Dublin Core直接引用,用来描述作者、主题等元数据 Dublin Core是一组“标准词汇集” (4)CycL: 一阶谓词逻辑的一种扩展 为增强知识表示的灵活性, 在一阶逻辑的基础上增加缺省知识的表示、二阶谓词等 CycL中有大量的类和类之间的关系 4.2.3 知识的本体表示 3.本体构建与映射 实际应用中需要: ●首先, 构建所需要的本体,从某个领域中抽取知识 形成描述该领域数据的语义概念、实例和其间关系 ●其次,在不同本体间进行知识共享并保持对同一领域知 识的共同理解 ●同时, 解决已有本体的维护和本体重用以及本体的服务 进行本体间的知识推理 这些需要进行本体间映射 4.2.3 知识的本体表示 (1)本体构建 包括本体语言和本体构建方法两种途径 目前本体构建方法多采用手工方式 即知识工程师借助于本体编辑器全手工的构建本体。 1)本体构建原理 本体构建实际上是一个知识获取的过程。 设计本体的基本准则可以归纳为如下五条: ① 明确性和客观性(Clarity): 本体应该有效地传达所定义的术语的内涵。 ② 一致性(Coherence): 一个本体应该是前后一致的 由它推断出来的概念定义应该与本体中的概念定义一致。 4.2.3 知识的本体表示 ③ 可扩展性(Extensibility): 本体提供的共享词汇应在预期任务范围内提供概念的基础同时它的表示应该使得能够单调地扩展和专门化对这个词汇的说明 也就是说人们应该能够在不改变原有定义的前提下 以这组存在的词汇为基础定义新的术语。 ④ 最小编码偏差(Minimal encoding bias): 本体应该处于知识的层次 而与特定符号级编码无关 4.2.3 知识的本体表示 ⑤ 最小本体承诺(Minimal commitment): 本体应在提供必须共享知识条件下有最小的本体承诺 应该对所模拟的事物产生尽可能少的推断 而让共享者自由地按照需要去专门化和实例化这个本体 具体实施一个领域本体构建可分为8个步骤: 本体需求分析 本体构建规划 获取本体信息 确定本体概念及关系 本体形式化编码 本体评价 本体演化 本体表示 4.2.3 知识的本体表示 2)基于文本的本体自动构建 对文本集合应用自然语言处理实现构建本体所需要素抽取 ● 基于字典本体构建 从机器可理解的字典中抽取相关概念以及概念间的关系 ● 基于知识库本体构建 将现有的知识库作为知识来源实现本体抽取 ● 基于半结构模式本体构建 从预先定义结构知识来源(如 XML Schema)中抽取本体 ● 基于关系型模式本体构建 从数据库中抽取相关概念及概念间关系形成本体 4.2.3 知识的本体表示 从基于文本本体构建来看,实现技术和手段可分以下几类 ① 基于模式的抽取: 通过词语出现模式刻画词语之间的关系 匹配文本中连续词语出现模式以识别词语之间的关系 ② 关联规则: 利用已有概念层次作为背景知识发现概念间非分类学关系 ③ 概念聚类: 概念间因语义距离差异而形成概念集合并产生层次结构 ④ 本体修剪: 基于不同的异构的知识来源生成领域本体。 ⑥ 概念学习: 从现实世界文本集合获取新概念并添加到已有的本体中 4.2.3 知识的本体表示 3)基于结构化数据的本体构建 从关系数据库中学习本体是一个半自动化的本体学习过程 ● 第一次扫描数据库的模式: 得到最初的一些粗糙的概念集合 扫描一趟得到每张表的元数据 可知这张表是否有主键 如果有主键就创建一个概念 ● 第二趟数据库模式的扫描: 找到概念与概念之间的对象属性关系 对于关系数据库中那些有外键的表 认为至少存在一个对象属性关系 通过外键找到前面对应的概念 然后再建立概念之间的属性关系 4.2.3 知识的本体表示 (2)本体映射 通过手工方式去发现和操作本体间映射是费时费力易错 本体映射机制可看作是对大量已有本体的有效利用 进而达到真正意义上知识共享的关键问题 1)本体映射体系结构 : ① 单本体结构: 一个全局本体为具体的语义说明提供共享的词汇表 所有信息源都联系到这个全局本体上 因而它们在语义上一致 4.2.3 知识的本体表示 ② 多本体结构: 每一个信息源都有自己本地本体 它们并不一定使用同样的词汇表
您可能关注的文档
最近下载
- 《旅行社经营与管理》课件 第一章 旅行社概述.ppt VIP
- 人教版八年级数学上册分式的加减法练习题精选47.doc VIP
- 最新【人教版】三年级数学上册教科书电子版教学课本(2025年秋-新教材版本).docx
- 【精选】申银万国行业分类标准(2014版).pdf VIP
- 3500个常用汉字整理完整.doc VIP
- 农村狗狗交配的全过程,让你看了有点不可置信.pdf VIP
- 2023——2024学年度第一学期北师大版小学数学一年级上册教学计划附教学进度表.docx VIP
- 新北师大版四年级数学上册第四单元《买文具》课件14.ppt VIP
- 8.2 掌握自驾游计调业务 课件《旅行社计调业务》(中国言实出版社).pptx VIP
- 申银万国行业分类.pdf VIP
文档评论(0)