- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术论文网络服务构建论文
数据挖掘技术现代网络服务系统构建研究
摘要:针对当前网络服务构建过程中出现的问题,提出了基于数据挖掘技术的网络服务系统模型,提出了系统的功能,达到根据用户当面访问行为,分析用户模式,动态为用户推荐页面,具有一定的应用价值。
关键词:数据挖掘;网络服务;数据预处理;关联规则
1 绪论
近年来,随着Internet技术和Web网络服务技术的迅速发展,网络已经成为一个巨大的、全球性的信息服务中心。随着网络服务信息量的迅速增长,传统的客户页面访问模式已经不适应客户的要求。针对这些问题,很多大型的网络服务提供商推出了个性化网络服务方式,提供不同服务策略和服务内容的服务模式,提前收集网络用户信息,分析用户行为和兴趣等,进而提供满足用户需求的网络服务。在现代网络服务构建过程中,往往面临网络服务数据量过大,用户信息收集困难等问题,解决这些问题的最有效的方法就是将数据挖掘技术应用到现代网络服务构建中。通过数据的有效挖掘,可以更好的了解用户兴趣,分析用户的访问模式,根据用户的个性需求,为用户实时提供推荐页面。
2 基于数据挖掘的现代网络服务系统结构及功能
2.1系统结构
进行Web数据挖掘的研究主要是为了将知识发现的结果应用到实际中,为科学决策提供支持。因此将Web数据挖掘运行在网络服务系统的用户数据库和数据仓库之上,根据Web数据挖掘个性化服务系统的作用及Web数据完决的一般流程,可创建一种基于数据挖掘的现代网络服务系统框架,如图1所示。该系统模型是基于关联规则挖掘思想,通过预处理获得的用户事物数据,采用改进后的频繁模式挖掘算法,发现用户的频繁访问路径,然后根据用户当前请求的页面,寻找匹配的模式,从而预测用户下一步要访问的页面,动态的提供页面的链接,使用户能够方便、快捷地找到自己所需要的内容。
2.2系统功能
现代网络服务系统信息收集部分可获取用户访问站点的所有信息,根据用户访问信息完成完挖掘操作。然后当用户再访问站点时,网站从挖掘模型进行调整,用户访问的将是调整后的新服务页面,网络服务运行的整个周期中,此过程不断反复运行。图1可以得出整个服务过程基本符合数据挖掘的一般过程,整个系统的运行由网络管理者通过与用户交互进行控制,整个系统功能可以分为以下三个方面:
(1)数据准备阶段。
数据准备模块是该模型的基础阶段,主要包括数据采集和数据预处理两个处理流程,具体如图2所示:
数据采集阶段首先将访问数据读入到关系数据库中,然后对数据进行预处理,转换为适合数据挖掘的可靠数据。将服务器上的日志文件中无用和无关的数据进行清理和合并后进行用户识别和会话识别。数据预处理操作是进行挖掘的关键问题,数据准备阶段是整个系统的基础。
(2)事务挖掘模块。
事务挖掘模块是整个系统的核心部分,面向用户及Web站点的服务方,她可以根据用户的需求通过传递参数的方式,调用相应的模式挖掘算法,对前面得到的事务数据库进行挖掘,分析用户的浏览兴趣。在进行模式挖掘时可采用的算法包括关联规则挖掘算法,用户聚类挖掘算法、用户分类挖掘算法以及序列模式挖掘算法等。本系统主要采用关联规则挖掘技术,挖掘用户事务中的强关联规则,并通过频繁访问模式挖掘算法挖掘用户频繁访问路径。该方法比较适合于站点访问用户比较多,新用户比较少的站点中,具有快速、准确的特点。因此在挖掘模块中要解决信息、规则库动态更新的问题,为用户提供更好的、动态的现代网络服务系统。
(3)实时监控模块。
实时监控模块对用户的访问行为进行监视,对用户下一步的操作行为进行在线预测。主要根据用户当前操作比对模式库,分析得出用户的使用模式信息,动态调整站点的显示内容和显示方式,将生成的推荐页面集合预送给用户,为用户提供个性化服务。监控模块的调整实现方式主要有:分析预测用户感兴趣的页面,增加链接的方式将这些页面的连接推荐给用户,调整站点结构以尽量缩短用户的访问路径,将浏览的路径以明显的形式提示用户。对用户使用模式的分析结果是网站结构进行再调整的重要依据,根据用户访问兴趣,调整网站现有的网页链接关系,有助于提高用户的访问效率。
3 关联规则在现代网络服务系统中的应用
3.1频繁访问模式挖掘
通过Apriori算法及其改进算法可以挖掘出数据库中的关联规则,但其挖掘对象主要是针对数据库中的无序数据。而在通过Web数据挖掘发现用户频繁访问模式时,挖掘对象是用户有序的页面访问路径,页面之间顺序不能颠倒,因此在进行频繁访问模式挖掘时和以往的挖掘算法有所区别。在Web数据预处理的基础之上已经生成了用户事务集合,通过最大向前引用路径方法识别的用户事务其实就是一个MFP。频繁遍历路径是指包含在MFP集合中满足一定支持度的连续页面序列。频繁遍历路径通常也称
您可能关注的文档
- 《杉木根精油提取及深加工研究》-毕业论文.doc
- 《杉木根精油提取及深加工研究论文》-毕业论文.doc
- 《陕西榆林红枣交易市场项目可行性研究报告》-毕业论文.doc
- 《陕西中微生物科技有限公司绩效管理探析论文》-毕业论文.doc
- 《商A0711班学习型组织构建问题分析》-毕业论文.doc
- 《商店自动门控制》-毕业论文.doc
- 《商洛桔梗种子品质检验与质量标准研究》-毕业论文.doc
- 《商贸学院学生教材管理系统的设计与开发》-毕业论文.doc
- 《商务活动中的中西方文化差异》-毕业论文.doc
- 《商务英语-文化差异对国际商务谈判的意义》-毕业论文.doc
- 《数据挖掘技术在课程相关性分析中的应用》-毕业论文.doc
- 《数据挖掘在电子渠道分流模型中的应用研究》-毕业论文.doc
- 《数据挖掘在陶瓷企业客户关系管理中的应用研究》-毕业论文.doc
- 《数控车床的基本应用》-毕业论文.doc
- 《数控编程论文:基于关系数据库的数控弯管成形有限元仿真管理系统研究与开发》-毕业论文.doc
- 《数控车床论文:连杆终锻模膛设计与数控加工》-毕业论文.doc
- 《数控车床尾座的改造设计》-毕业论文.doc
- 《数控车床电主轴的设计研究论文》-毕业论文.doc
- 《数控车工论文:数控技术实训中的项目式教学研究》-毕业论文.doc
- 《数控车削加工误差分析与研究》-毕业论文.doc
最近下载
- 层析包括吸附层析分配层析离子交换层析亲和层析等 (2).pptx VIP
- 2019主持人大赛总决赛第三轮巅峰对决王嘉宁VS邹韵演讲稿.doc VIP
- 《房屋建筑学》第6章 建筑构造概论.ppt VIP
- 2025年河北省涿州三中学初三九月月考物理试题含解析.doc VIP
- 超星尔雅学习通《通识写作怎样进行学术表达(复旦大学)》章节测试答案.docx VIP
- C++龟兔赛跑代码.docx VIP
- 人教新版英语九年级Unit1-4试卷.doc VIP
- C++书写日历代码.docx VIP
- 食品仓储安全保障措施.docx VIP
- 辽宁省抚顺市新抚区2024-2025学年八年级上学期10月月考语文试题.docx VIP
文档评论(0)