基于关联规则挖掘的查询扩展-管理科学与工程专业论文.docxVIP

基于关联规则挖掘的查询扩展-管理科学与工程专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联规则挖掘的查询扩展-管理科学与工程专业论文

摘 要 伴随着 Internet 信息资源的不断丰富,当用户使用搜索引擎检索信息时候会反馈大 量无用的信息链接,因此,现有搜索引擎越来越不能满足人们查询的速度及准确度要求。 由于用户浏览的网络日志记录着用户访问网页时的行为和网页信息,直接反映了用 户使用网络的规则和兴趣,通过挖掘用户浏览网页的日志及其内容,可以提取用户的兴 趣,根据用户的兴趣,建立描述用户的配置信息文件,在用户使用网络搜索引擎进行搜 索时,参考用户的兴趣模型,对用户提交的查询词进行修正和查询扩展,提高查询词描 述的准确度,并对查询结果根据用户使用网络的关联规则和用户兴趣进行重新排序,以 便提高用户查询信息的效率。 本文在对 Web 日志挖掘、关联规则挖掘、查询扩展等相关原理与技术分析的基础 上,深入分析了客户端用户网络日志的挖掘和基于用户兴趣模型的关联挖掘提取等关键 技术,具体研究成果如下: 通过开发 IE 插件,在客户端收集用户浏览网页的行为及日志信息,分析用户的网 络日志,挖掘用户访问网络的习惯,对用户访问的网页的 URL 进行挖掘分析,提取用 户的兴趣类,并同时将 Web 内容根据其 URL 的描述特征进行分类,对相同类别的网页 内容进行聚类分析,对分类集进行挖掘并提取用户的兴趣特征。 根据用户兴趣特征及用户兴趣集,建立基于树状的用户兴趣模型,根据用户兴趣模 型,对用户进行浏览网页的关联规则进行挖掘,挖掘其频繁项集。 根据用户的兴趣模型和用户兴趣的短语特征集,在用户使用搜索引擎进行信息检索 的时候,对查询词进行查询扩展,对搜索引擎反馈的结果根据用户浏览网页的关联规则 频繁项集进行重新排序,提高用户查询信息的效率。 关键词:日志挖掘,兴趣模型,关联规则,项目约束,查询扩展 I ABSTRACT With the wealth of Internet information resources continually, when users retrieve information using a search engine when a lot of useless information will be feedback link, so search engines can not meet the existing one for the speed and accuracy requirements. As users browse the web logs record the behavior of users to access web pages and web information, a direct reflection of the rules and user interest in using the network, through mining user browsing the web log and its contents, you can extract the users interest, according to the users interest , the establishment of the configuration information file describes the user in the Web search engine users search, the reference to the users interest model, the user submits a query term correction and query expansion to improve the accuracy of query words described, and the query results based on users use the network and the user interest of association rules to re-sort information in order to improve the efficiency of user queries. In this paper, on the Web log mining, association rule mining, query expansion, and other related principles and technical analysis, based on in-depth analysis of the client user network log mining and associated user interest model based extraction o

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档