- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联规则挖掘的查询扩展-管理科学与工程专业论文
摘 要
伴随着 Internet 信息资源的不断丰富,当用户使用搜索引擎检索信息时候会反馈大 量无用的信息链接,因此,现有搜索引擎越来越不能满足人们查询的速度及准确度要求。
由于用户浏览的网络日志记录着用户访问网页时的行为和网页信息,直接反映了用 户使用网络的规则和兴趣,通过挖掘用户浏览网页的日志及其内容,可以提取用户的兴 趣,根据用户的兴趣,建立描述用户的配置信息文件,在用户使用网络搜索引擎进行搜 索时,参考用户的兴趣模型,对用户提交的查询词进行修正和查询扩展,提高查询词描 述的准确度,并对查询结果根据用户使用网络的关联规则和用户兴趣进行重新排序,以 便提高用户查询信息的效率。
本文在对 Web 日志挖掘、关联规则挖掘、查询扩展等相关原理与技术分析的基础 上,深入分析了客户端用户网络日志的挖掘和基于用户兴趣模型的关联挖掘提取等关键 技术,具体研究成果如下:
通过开发 IE 插件,在客户端收集用户浏览网页的行为及日志信息,分析用户的网 络日志,挖掘用户访问网络的习惯,对用户访问的网页的 URL 进行挖掘分析,提取用 户的兴趣类,并同时将 Web 内容根据其 URL 的描述特征进行分类,对相同类别的网页 内容进行聚类分析,对分类集进行挖掘并提取用户的兴趣特征。
根据用户兴趣特征及用户兴趣集,建立基于树状的用户兴趣模型,根据用户兴趣模 型,对用户进行浏览网页的关联规则进行挖掘,挖掘其频繁项集。
根据用户的兴趣模型和用户兴趣的短语特征集,在用户使用搜索引擎进行信息检索 的时候,对查询词进行查询扩展,对搜索引擎反馈的结果根据用户浏览网页的关联规则 频繁项集进行重新排序,提高用户查询信息的效率。
关键词:日志挖掘,兴趣模型,关联规则,项目约束,查询扩展
I
ABSTRACT
With the wealth of Internet information resources continually, when users retrieve information using a search engine when a lot of useless information will be feedback link, so search engines can not meet the existing one for the speed and accuracy requirements.
As users browse the web logs record the behavior of users to access web pages and web information, a direct reflection of the rules and user interest in using the network, through mining user browsing the web log and its contents, you can extract the users interest, according to the users interest , the establishment of the configuration information file describes the user in the Web search engine users search, the reference to the users interest model, the user submits a query term correction and query expansion to improve the accuracy of query words described, and the query results based on users use the network and the user interest of association rules to re-sort information in order to improve the efficiency of user queries.
In this paper, on the Web log mining, association rule mining, query expansion, and other related principles and technical analysis, based on in-depth analysis of the client user network log mining and associated user interest model based extraction o
您可能关注的文档
- 基于公共安全视角的电网设备集中监造模式研究-公共管理专业论文.docx
- 基于公共安全优先的城市综合交通枢纽建运一体模式研究-管理科学与工程;工程管理专业论文.docx
- 基于公共安全理论的城市消防管理体系研究-工程项目管理专业论文.docx
- 基于公共安全视角的企业社会责任项目投资研究-安全工程专业论文.docx
- 基于公共信息资源的咨询服务分析-工商管理专业论文.docx
- 基于公共密钥基础设施的小型认证中心的研究与设计-计算机应用技术专业论文.docx
- 基于公共定价理论的赤峰热电厂热产品定价研究-工商管理专业论文.docx
- 基于公共受托责任理论的政府绩效审计研究-会计学专业论文.docx
- 基于公共审计治理理念的国家审计信息披露研究-会计学专业论文.docx
- 基于公共平台的医疗服务产品族设计及评价研究-社会医学与卫生事业管理专业论文.docx
- 基于关联规则挖掘算法的分析型CRM的设计与实现-机械制造及其自动化专业论文.docx
- 基于关联规则挖掘的分类算法分析-管理科学与工程专业论文.docx
- 基于关联规则数据挖掘的分析-软件工程专业论文.docx
- 基于关联规则挖掘的背景知识攻击及隐私保护研究-电子商务与信息技术专业论文.docx
- 基于关联规则的Web日志挖掘技术分析-计算机应用技术专业论文.docx
- 基于关联规则挖掘的仪表生产质量管理研究及系统设计-计算机应用技术专业论文.docx
- 基于关联规则的个性化推荐算法研究-系统工程专业论文.docx
- 基于关联规则数据挖掘的研究-控制理论与控制工程专业论文.docx
- 基于关联规则的不平衡数据分类方法研究-管理科学与工程专业论文.docx
- 基于关联规则汽轮机组运行优化参数最优值的确定-热能工程专业论文.docx
最近下载
- 基于KPI(关键绩效指标)的绩效考核.pptx VIP
- 工程点工签证单.doc
- 14K207 管道设备防腐蚀设计与施工(OCR).pdf VIP
- 临床护理文书书写规范 (1) PPT课件.pptx VIP
- SHARERESTRICTIONAGREEMENT(股东限制协议).doc VIP
- [最新版]市政道路工程监理实施细则100页(参考价值高编制).doc VIP
- 2025-2030中国航行数据记录器行业市场发展趋势与前景展望战略研究报告.docx
- 基于TMR传感器的地磁信号采集与校准研究.pdf
- 影响生物修复的环境条件.ppt VIP
- 2023北京人大附中初二(上)期中物理(含答案).pdf VIP
文档评论(0)