Deep+Web数据源质量估计模型及应用研究.pdf

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Web数据源质量估计模型及应用研究 中文摘要 Deep Web数据源质量估计模型及应用研究 Deep 中文摘要 库所深化。这些信息隐藏在Web查询接口之后,由站点后台数据库动态产生,而传 Web。 统搜索引擎受技术限制无法对它们进行索引,我们称这类信息为Deep Web信息的获取至今仍然是一个新兴的研究领域,也受到越来越多研究人 Deep Web进行大规模信 员的重视。为了方便用户获取某领域的DeepWeb信息,对Deep 息集成的研究就应运而生了,该集成框架包括数据源发现、数据源分类、数据源选择、 Wreb数据源质 查询结果合并等模块的研究。本文在上述集成框架下提出了一个Deep 量估计模型,基于该模型对数据源选择进行了应用研究,并提出了相关的选择算法。 本文的主要研究内容包括: Web资源的结构和分布做 (1)介绍了DeepWeb信息集成系统框架,对中国Deep 了调查研究。 W.eb三个方面的特性,并分别从三方面提取了影响数据源质量 (2)分析了Deep 的属性。 (3)分别采用了机器学习方法和模糊综合评价方法,对影响数据源质量的特征建 立了质量估计模型。 Web数据源 (4)应用上述质量估计模型,结合查询相关性及查询准确性对Deep 的选择做了应用研究。 最后对文中提出的方法和技术进行了实验设计,通过对数据源选择实验结果的分 析验证了提取特征的合理性和有效性,并比较了采用机器学习方法和模糊综合评价方 法建立质量估计模型的优缺点。 关键词:深网,搜索引擎,机器学习, 信息反馈, 查询接口 作 者:胡鹏昱 指导老师:崔志明 Researchon EstimationModelof WebDataSourcesand Quality Deep Application Researchon EstimationModelof Web Quality Deep DataSourcesand Application Abstract Witllthe ofIntemet Webhasbeen rapiddevelopment technology,the rapidly searchabledatabasesonline.Aamountof information deepenedbymyriad large dynamic fromthedatabasesbehind interfacescallnotberetrievedbecaus

文档评论(0)

tkhyxy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档