- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语义智能Web挖掘技术研究
基于语义智能Web挖掘技术研究
摘要:目前,基于语义的Web挖掘技术结合了语义Web与Web挖掘两个领域,并且在一定程度上促进了各自的发展。本文介绍了语义网与Web挖掘、智能代理相关概念的体系构造,并且提出了基于语义的Web挖掘信息体系模型??建智能采集体系的代理框架,通过分析表明该体系模型在一定程度上提升了信息获取的智能水平。
关键词:语义;web挖掘;智能技术
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2018)08-0147-01
1研究概述
Web挖掘与传统数据挖掘不同,能够有效挖掘互联网上非构造化异构Web文档集合。Web挖掘的内容的类型通常是内容、构造挖掘与使用记录挖掘。
伴随社会经济与相关资料相关技术的全面发展,搜索活动已被整合到社会经济的各个角落。相关资料搜索产业作为国内外蓬勃发展的产业,已成为社会经济体系的重要组成部分。相关资料搜索行业具有广泛的工作范围,如政策搜索、管理搜索、工程搜索、相关技术搜索、专业搜索等。各类搜索活动都体现了现代搜索的重要功能之一――科学决策。但是,伴随大数据时代的到来,相关资料的存在方式发生了巨大的变化,数据结构与传输方式多样化的多样性,使得传统的相关资料搜索服务,客户满意度低,自发化程度不高,难以满足组织与个人的需求。丰富的知识元素与智力是隐藏在巨大而多样化的相关资料背后的,但却没有及时发现与有效利用,这严重影响了相关资料搜索活动的效率。本文在观察解析文本与网络语义智能搜索服务模式与系统体系结构、文本与网络语义观察解析方法与人工智能相关技术在搜索服务中的应用的基础上,提出了提高搜索服务智能化水平的建议。
2在多主体框架下构建信息智能获得体系模型
在文本与Web语义观察解析基础上构建对象本体知识元素库。经过自然语言处理,并将非结构化文本数据观察解析为可操作的相关资料,使用结构化文本数据中的数据挖掘相关技术与工具提取相关知识元素,结合机器学习与自然语言处理相关技术相结合,实现了基于公理/规则的自发对象本体学习,并构建了领域对象本体。基于对象本体知识元素基础构建,将对象本体知识元素运用到领域知识元素的形式化,明确地对资源深度组织与利用,基于知识元素库的实现,以提供语义支持;基于对象本体知识元素库对文本与Web资源的语义注释,经过对目标文档的语义标注自发分类索引,实现网络资源与域对象本体的匹配映射。
代理是一种智能软件实体,能够在特定的环境中与相关的代理进行通信。代理人通常拥有自主权、社会性、主动与被动的反应能力、自我适应能力与机动性。
基于Web挖掘与语义Web的理论,利用智能代理技术建立了信息智能采集体系模型(agbase-basedsem iantic-ieb),并且对其进行了分析。这个体系模型包含了以下如图1所示。
基于对象本体知识元素库的交互指导模式如图所示。观察解析使用者的初始需求,建立自发启发式与规则,智能地引导使用者索引相关资料,实现使用者需求挖掘;在过程中动态交互,不断使用对象本体知识元素库推论,使用自然语言观察解析相关技术,结合对象本体知识元素库,实现使用者的自发解析与查询扩展,使使用者在索引相关资料问题的过程中自发识别、诊断、交互搜索,设置使用者问题与搜索系统相关阈值,进行边界筛选来解决问题;经过知识元素管理、积累与动态更新搜索服务知识元素、相关技术与流程,搜索服务伴随使用者、资源与相关技术的变化而发展。建立搜索与转发机制,及时搜索与解决系统不能解决的问题。
对象本体代理的主要任务是维护对象本体库,以更新与共享对象本体知识元素。对象本体代理使用对象本体的语义知识元素,并扩展查询请求,即语义处理,语义过滤与结果集群处理是为了提高返回相关资料的相关性。我们还能够利用Web挖掘相关技术来辅助对象本体论学习来丰富与扩充对象本体论数据库。
使用者代理与对象本体代理与索引代理进行交互,以完成使用者的查询请求的提交、概念提取与返回结果的可视化,以及使用者的评价与反馈。当使用者代理接收到使用者的查询请求时,它使用对象本体代理来执行语义扩展与其他处理,然后将处理过的查询请求发送给索引代理以获取相关资料。使用者代理处理返回的结果并执行可视化处理,同时学习使用者的反馈与评估。
RDF数据库主要是从数据源中存储相关资料采集代理,并以RDF格式、资源数据单元、三元组(AOV)形式、挖掘数据预处理(如语义标注等)的属性与属性值,同时也为对象本体学习做准备。对象本体库是该系统的核心部分,它提供了共享的语义知识元素,并澄清了RDF数据的概念、关系与推论规则。它是对象本体学习与集成的基础,为其他代理提供了共享的语义支持,并存储与管理了对象本体代理所发现的新对象本体。
协调代理是多代理
您可能关注的文档
最近下载
- 怎样选购冰箱.doc VIP
- 2025年新生儿窒息复苏考试试题(附答案).docx VIP
- 系统性红斑狼疮护理查房.ppt VIP
- 魏晋玄学课件.ppt VIP
- 2020安徽芜湖一中高一自主招生考试语文试卷真题(含答案详解).pdf VIP
- 小学科学苏教版四年级上册第三单元《常见的力》教案(共4课)(2020新版).pdf
- 2024年包头市九原区社区工作者招聘真题 .pdf VIP
- 2021年安徽芜湖一中高一自主招生考试语文试卷真题(含答案详解).pdf VIP
- 二年级数学上册 作业本提优-第三单元提优测试卷 (含答案)(苏教版).docx VIP
- 工作票签发人负责人许可人上岗资格考试题B卷答案.docx VIP
文档评论(0)