基于本体的语义Web 文本分类探讨.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于本体的语义Web 文本分类探讨.doc

基于本体的语义Web 文本分类探讨 黄显堂 (浙江温州大学图书馆 温州325003) 摘要:本文探讨了本体与语义Web的关系、本体在语义Web文本分类中的作用,并重点探讨了基于本体的语义Web 文本分类的特点以及Web文本分类器的一般工作原理。 关键词:本体 语义Web 文本分类 中图分类号:G254.364;TP301. 2 Research on Semantic Web Texts Classification Based on Ontology Huang Xian-tang (Library of Wenzhou University Wenzhou 325003) Abstract: This article has discussed the relations between ontology and semantic Web, the functions of ontology in semantic Web text classification, and has discussed the semantic Web text classification characteristic based-on ontology as well as the Web text classification sorter general Operational mechanism with emphasis. Keywords: Ontology;Semantic Web;Text Classification 1、引言 当前Web上的信息是一种无结构或半结构的数据,只能供人阅读而不能被计算机所理解,因而也就不能自动化处理,如何对网页尤其是对网页上的文本进行自动分类,已成为信息提取和信息检索面临的一个重要课题。为了解决这个问题,本体在Web上的应用导致了语义Web的诞生,其目的是解决Web上信息共享时的语义问题。Berners-Lee于2000-12-18在XML2000的会议上正式提出了语义Web[1],它的目标是使得Web上的信息具有计算机可以理解的语义,满足智能软件代理(Agent)对WWW上异构和分布信息的有效访问和搜索。语义Web可以看作是在本体理论基础之上对现有Web所进行的扩展,目标是使Web上的信息具有计算机可以理解的语义。因此,在本体的支持下可以实现Web文本的自动分类。 2、本体与语义Web的关系 本体(Ontology)是语义Web中的元数据,它以机器能够理解的方式描述数据的语义,代理可以在机器之间进行通信,以提供更多的自动化服务。基于本体的语义Web根据语义Web的体系结构,语义网的实现离不开XML语言和RDF。XML+RDF+Ontology构成了相互理解的基础,同时成为语义Web体系结构的核心[2]。但是XML和RDF在处理语义上存在两个问题:一是同一概念有多种词汇表示;二是同一个词有多种含义(概念)[3]。因此,必须在语义层次上解决Web信息共享和交换的问题。本体通过对概念的严格定义和概念之间的关系来确定概念的精确含义,表示共同认可的、可共享的知识,从而解决一词多义以及多词近义等问题,因而在语义Web中具有非常重要的地位,是解决语义层次上Web信息共享和交换的基础。这样在使用XML定义标签格式和RDF表达数据后,可以使用一种本体的网络语言(如OWL)来描述网络文档中的术语的明确定义及其之间的关系。本体作为Berners Lee所提出的语义Web体系结构的第三层,为语义Web提供了相关领域的共同理解,确定了该领域内共同认可的概念的明确定义,通过概念间关系描述了概念的语义。本体层为语义Web提供语义级的共享,使得人及机器间能够进行语义交互。 3、本体在语义Web分类中的作用 本体作为网络信息的组织与检索的基础,通过对信息内容的约束确保一致性和正确性,在语义Web自动分类中起着重要的作用,主要可以从以下几个方面来理解: 3.1 利用本体作为结构化Web信息和组织知识库的基础。 一方面,本体作为一个领域的概念框架可以用来理解和组织知识库,因为它澄清了领域知识的结构,从而为知识表示打下了良好的基础,而本体描述语言又能将Web上概念和概念之间的关系描述出来,它将逻辑定义和关系用一组限定的词汇进行表达,采用XML的语法以适应Web上传输的需要。而且,本体可以重用,从而可以避免重复的领域知识分析,其统一的术语和概念也使知识共享成为可能。另一方面,本体也提供了系统元数据的词汇表来注解数据和描述文件。有了本体就能够对文档进行一种更为准确的划分。可以准确的了解文档是关于哪一个领域,哪一个概念的,换句话说,这种划分提供了一种标准的分类,这种标准的分类为以后可能的查询提供了一个基础。 3.2

文档评论(0)

dyx0821 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档