决策树对构造领域本体的作用.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
决策树对构造领域本体的作用

决策树对构造领域本体的作用 ; 领域本体是专业性的本体,提供了某个专业学科领域中概念的词表以及概念间的关系,或在该领域里占主导地位的理论。领域本体构建的方法:知识工程方法、企业建模法、循环获取法、methontology、IDEF-5、Bemerasetal等。然而,要了解本体构建完整的过程,骨架法在所有方法中最具有参考性,它提供一个本体构建的方法学框架,所以本文使用数据仓库中的一些相关技术、数据挖掘中决策树的分类与预测的技术,以骨架法的中心思想作为参考和指导方针来构建领域本体,最后对构建好的本体模型进行文档化。以下提到的本体均指领域本体。; 1决策树的相关知识; 决策树是一种类似于流程图的树结构;其中,每个内部节点(非树叶节点)表示在一个属性上的测试,每个分枝代表一个测试输出,而每个树叶节点(终点)存放一个类标号,树的最顶层节点是根节点。在本体的构建过程中树节点代表类或者属性,节点间的连接线代表类与类或者类与属性或者属性与属性之间的关系,即可传递性、单继承性。决策树的构造不需要任何领域知识或参数设置,因此适合于探测知识发现;获取的知识用树的形式表示是直观的,并且容易被人理解;决策树归纳的学习和分类步骤是简单和快速的;一般情况下,决策树分类器具有很好的准确率。; 1.1骨架法方法的研究; 骨架法(MikeUsholddedeamp;KingUsc95)又称ENTERISE法,是英国爱丁堡大学人工智能应用研究所根据用于企业建摸的Enter-priseOntology所得出来的。; 1.2骨架法的步骤:; a.确定构建本体的目的和范围;b.构建本体;c.本体评估;d.文档化本文使用数据仓库中的一些相关技术、数据挖掘中分类与预测的决策树技术,以骨架法的中心思想作为参考和指导方针来构建领域本体,最后对构建好的本体根据决策数提取规则的特点进行文档化。; 2构建本体的过程———以构建现代交通工具本体为例; 2.1领域需求分析; 领域需求分析是构建本体的重要阶段,没有充足的领域分析就不可能构建出好的本体.交通工具是为了满足人们出行的需求而研制的,并且在不段的发展变化。所以在进行领域分析的时候要以发展创造的观点来进行领域需求分析,即进行领域分析的同时要进行趋势的预测。层次一:客观描述与记录(objectivedescriptionandrecord)———对领域需求进行精确、全面地搜集与记录客户的需求或相关的业务、数据。层次二:模式归纳与发现(patternsinductionanddiscovery)———按照一定的建模方法论及框架进行归纳\建模,并尽量揭示在包含在快照的客观记述中并非显而易见的模式或规律;层次三:模式分析与预测(patternsanalysisandinnovation)———在现存模式的基础上总结不同模式背后隐含的规律,研究应用对需求的异化作用,发觉深层次规律,预测需求变化,揭示新的工作方式,创建新的、有价值的模式。; 2.2利用决策树算法创建本体; 本体模型的表示形式有多种,这里采用分类决策树来表示;本体的生成方法有三种,这里采用自顶向下的生成方法。根据领域需求分析,经过属性的不断叠加、迭代,得到本体的决策树。; 2.2.1领域本体集成。领域本体集成的关键技术是本体映射,而本体映射定义一套规则,指明一个本体中的术语在另一个本体中的相关含义,由中介(mediator)在应用程序运行时执行。本体决策树所提取的规则之间都是互斥的,每个树叶都有一个规则,并且任何一个属性都只能映射到一个树叶。; 2.2.2本体构建工具。在这里使用Protégé,它是由斯坦福大学研制开发的、基于Java环境的本体开发工具,它允许用户自己定制知识获取界面的特点来构建本体。; 2.3本体评估; 本体构建过程中使用决策树构建的原理,使用分类决策树所构建的本体具有很多优点,如下;利用分类决策树所构建本体的学习和分类步骤是简单和快速的,而且本体类中属性的分类具有很好的准确率;这种本体的构建适合于探测知识发现;本体分类决策树模型表示是直观的,并且容易被人理解。; 2.4文档化; 对上面本体的分类决策树模型使用IF-THEN规则分类。使用IF-THEN规则得到文档图,每一条分支为一个元组,所有的分支数为数据集|D|,设ncovers为乘坐R交通工具的元组数,ncorrect为正确分类的元组数,则我们可以得到乘坐这种交通工具的覆盖率和准确率,公式:Coverage(R)=ncovers/|D|,Accuracy(R)=ncorrect/ncovers,结果如表1所示。; 结束语; 领域本体的构建是一个增量迭代的开发过程,也是一个创造性的过程,对任何专业领域来说,由于应用平台不同,设计者对专业领域的理解不同,构建出来的本体也不同。本文提出的是以骨架法作为参

文档评论(0)

ailuojue1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档