(毕业设计论文)领域专家知识在本体半自动构建中的作用机理研究.docVIP

(毕业设计论文)领域专家知识在本体半自动构建中的作用机理研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
领域专家知识在本体半自动构建中的作用机理研究 [摘要]解析领域本体半自动构建的流程,指出专家知识在本体半自动构建中的作用特点。基于流程分析领域专家在本体半自动构建中贡献知识的4个关键作用点和4个一般作用点,以及在不同作用点上的作用深度、作用方式和作用冲突,进而剖析领域专家知识在本体半自动构建中的作用机理。 [关键词]领域专家 专家知识 本体半自动构建 作用机理 1 引言 本体作为一种明确的规范化概念说明,以其在领域内达成共识的概念体系来克服计算机系统之间的“语义鸿沟”,其目的是要实现计算机的可理解。领域本体的构建离不开领域专家的知识。领域专家是指精通某一领域的知识、有独到的见解,在本领域的实践中具有专门技能、知识和经验的人。领域专家知识的利用和挖掘越深入、领域专家之间达成共识的程度越深,所构建的本体也就越具公认性性与权威性。目前国内外关于领域专家在本体构建中作用的论述比较零散,虽然几乎所有关于本体构建的论文都承认并肯定了领域专家知识的重要性,但没有对此进行系统、深入的研究,使其成为一个盲点。目前的研究基本上集中于以下几方面: ·领域专家的作用与价值。如liao s c等(2009)和na j c等(2009)均肯定了领域专家对概念的准确区分的价值;李景则将领域专家的价值融入到本体构建工程中。 ·领域专家数量与意见冲突问题。chi y l等(2009)、方安等(2009)认为创建本体过程中产生误差的关键原因是专家之间的偏见及不同意见;周宁等(2009)提出应寻求更多领域专家一起参与建立、修改和优化本体的机制。 ·领域专家参与的程度与环节问题。kayed a(2005)、马静等(2007)认为在本体构建的多数环节都需要领域专家的参与;刘琳娜等(2007)和刘仁宁等(2008)认为领域专家参与程度影响了知识表达的全面性;宗南苏等(2009)对领域专家参与本体构建的方法问题进行了研究。 本体构建是一种以知识结构的揭示为核心的工作,因此运用系统方法探索领域专家介入的时机、程度、与本体知识结构的作用方式和作用机理,研究领域专家之间、与信息管理专业人员协作沟通的方式和效果就极为重要。 2 半自动本体构建一般流程 相对于完全依靠专家人工构建本体的方法,半自动本体构建可以降低难度和成本,节省时间,提高效率,因此得到更多的青睐和应用。专家在人工构建本体与半自动构建本体中作用的最大差异在于确定概念和关系的方法方面。专家进行人工构建本体的方法,需要专家们在确定概念和概念关系环节中,完全依赖自身的专业知识和对知识的理解打造概念体系,成本高,效率低。在半自动本体构建方法下,首先可以采用自动分词处理文献源,或者使用相关领域内已形成的叙词表、专业词典中的术语或概念,还可以利用其他的本体的概念体系来初步形成概念及关系体系,而后专家针对初步形成的概念体系进行确认和局部修改,因此成本低,效率高。本文主要研究在半自动领域本体构建过程中领域专家知识的作用方式和过程。 半自动领域本体构建流程如图1所示: 2.1确定领域,明确目的阶段 首先,构建本体需要明确所构建本体所应覆盖的专业领域、应用本体的目的、作用及系统开发、维护和应用的对象。 2.2本体构建的半自动处理与概念、关系的确定阶段 目前的本体半自动构建有两种主体思路:一是在领域本体构建的初级阶段,运用自动化方法从特定的数据源中自动提取概念和关系,然后采用人工的方式对概念和关系进行准确界定和进一步深化;另一种是选择复用本体,通过本体映射或者本体改造,形成新的本体。 在第一种思路下,首先要进行领域本体概念及基本关系的自动化提取。提取对象主要有三种:叙词表、专业词典和本领域的典型文本。这三种典型的自动化处理数据源各有优缺点。叙词表和专业词典规范性强,但通常是每隔6年以上才会修订一次,因此所收录概念的时效性较差,而目前知识的更新速度很快,因此如果仅以叙词表和专业词典为目标进行自动化处理,处理结果将缺乏领域内的新概念。领域内文本的规范性差,需要借助文本自动分析和切分等技术进行处理,但这些文本通常以期刊学术论文、网络文本为主,所以具有很好的时效性,能够反映领域内最新的知识,从而提取出最新的概念和术语。以上的几种数据源应结合使用。自动化提取之后,就进入人工干预阶段。自动化提取到的关系仅仅是简单的等级和类属关系,专家需要在关系界定和深化这一环节通过人工干预,确定概念群及关系。 在第二种思路下,可以选择一些相近的本体,然后进行新的本体概念体系的构建。例如以其他组织开发出来的本体作为复用本体,然后通过建立本体映射,或者按需要对其进行改造。通常的方式是从中挑选出重要的概念项,保留或借鉴可复用的概念属性和概念间的关系,提取或设立抽象概念作为组织特性,从而最后定义类及类的等级体系、定义类的属性、关系和创建实例等,最后形成所构建本体的整体框架。

文档评论(0)

秦圈圈 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档