基于Ｗｅｂ的本体学习模型的设计与实现.docVIP

下载本文档

1
0
约6.1千字
约 9页
2018-03-16 发布于北京
举报
版权申诉

基于Ｗｅｂ的本体学习模型的设计与实现.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Ｗｅｂ的本体学习模型的设计与实现　　摘要：对本体（ontology）的研究在计算机科学领域变的越来越广泛，但手工构建本体是一项繁琐而辛苦的任务，还容易导致知识获取瓶颈，无法保持本体的更新。本体学习技术是利用本体工程技术和机器学习技术等众多学科技术来实现本体的自动或半自动构建。该文提出了基于Web的本体学习模型，分析了模型实现中的文档预处理、术语抽取、概念选择、概念分类等关键技术。　　关键词：本体；本体学习；知识获取；本体评估　　中图分类号：TP393文献标识码：A文章编号：1009-3044(2008)23-1005-03 　　Design and Realization for Ontology Learning Model Based on Web 　　WU Yu-huang, LI Yu-sheng 　　(Network Center, Wuhan Polytechnic University, Wuhan 430023, China) 　　Abstract: To ontology the research changes in the computer science domain is getting more and more widespread, but constructs the ontology is manually an item tedious and the laborious duty, but also easy to cause the knowledge gain bottleneck, is unable maintains the ontology the renewal.The ontology learning technology is and so on numerous discipline technologies realizes the ontology using the ontology engineering technology and the machine learning technology automatic or the semiautomatic construction.This article proposed based on the Web ontology learning model, analyzed the model to realize the documents pretreatment, the term extraction, the concept choice, the concept classification and so on key technologies. 　　Key words: ontology; ontology learning; knowledge acquisition; ontology evaluation 　　　　1 引言　　　　目前对于本体的研究在计算机科学领域变的越来越广泛，人们对本体的需求也越来越多，且本体在众多领域的应用都是在构建本体的基础之上实现的，但本体的构建却是一项繁琐而辛苦的任务。手工方式构建的本体需要耗费大量的人力和时间，像Cyc和WordNet等系统需要使用人工为本体输入大量的知识，然后系统才能使用其庞大的知识库进行推理或是获取新的知识。这就容易导致知识获取瓶颈，无法保持本体的更新。因为本体中的知识是变化的，它总是在不断地发展和更新。这就决定了本体不能以手工方式构造，我们需要自动或半自动方式来构建本体。因此，本体学习技术[1]应运而生，它旨在综合众多的学科技术来促进本体的自动或半自动构建，特别是本体工程技术[2]和机器学习技术[3]。本文提出一种基于Web的本体学习的模型，讨论模型实现过程中的Web文档预处理、术语抽取、生成领域概念集、概念分类结构的建立等，并对模型进行测试。　　　　2 本体学习模型设计　　　　本文旨在实现从Web页面中自动抽取本体，从Web页面数据中找出本体语义概念的模式及其关系。它通过分析同一应用领域Web页面集来半自动化地抽取Web本体。本文提出的本体学习模型如图1所示，本体学习的整个过程包括Web文档预处理、生成候选关键词集、术语抽取、概念选择（生成概念集）、概念分类。使用多种数据源收集、选择和预处理Web文档，生成候选关键词集，再从候选关键词中抽取候选术语，形成领域术语项学习信息的初始列表，最后通过概念选择过滤与领域不相关的术语，得到领域本体概念。　　2.1 Web文档预处理　　Web页面中的数据大多数是非结构化或半结构化的，所以把文本从非结构化的形式表示成计算机可以处理的结构