Web使用挖掘方法及其在个性化学习系统中应用研究.doc

Web使用挖掘方法及其在个性化学习系统中应用研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中国广播电视大学沧州分校 大专毕业论文 Web使用挖掘方法及其在个性化学习系统中的应用研究 专业名称:计算机应用 作者名称:张慧娟 学 号:063150193 指导老师:付博明 日期:2008年4月18日 Web使用挖掘方法及其在个性化学习系统中的应用研究 摘要 数据挖掘就是从海量数据的集合中发现有效的、新颖的、有用的、可理解的模式。 Web使用挖掘是数据挖掘技术在Web使用数据上的应用,它的主要任务是研究用户的 浏览行为,发现用户对网页的兴趣度和访问模式,从而可以改进网站结构,为用户提 供个性化服务。 本文的研究内容包括:(l)对web使用挖掘的特点、方法及相关技术分析,指出了 现有Web使用挖掘的数据采集技术的不足;(2)提出一种综合获取用户浏览信息的方 法;(3)讨论基于图结构的Web访问序列模式挖掘方法;(4)提出基于内容过滤和协同过 滤相结合的个性化推荐算法;(5)将Web使用挖掘技术应用于远程学习系统,通过web 使用模式挖掘对学习者访问学习网站和使用学习资源的信息进行挖掘分析,及时了解 学习者的学习需求、学习进度、兴趣爱好,适时推出个性化的学习模式,构建个性化 的网络学习系统。 本文的主要特色:把基于内容过滤的推荐算法和协同过滤的推荐算法相结合;在 传统的学习网站中加入了个性化推荐模块,从而更加适应现代的个性化教育理念。 关键词:数据挖掘;Web使用挖掘;兴趣度;个性化学习推荐 作者:张慧娟 目录 第一章 绪论1 1.1研究背景与意义1 1.2研究内容与论文组织结构2 第二章 Web使用挖掘技术 4 2.1数据挖掘概述 4 2.1.1数据挖掘概念 4 2.1.2数据挖掘方法和技术4 2.1.3数据挖掘过程6 2.2web挖掘技术7 2.3web使用挖掘10 2.3.1Web使用挖掘流程10 2.3.2模式发现算法12 2.4序列模式挖掘13 2.4.1序列模式的提出13 2.4.2序列模式的相关概念及定义13 2.4.3序列模式的主要算法15 APriori算法 15 GSP算法 18 FP一Growth算法19 Prefixspan算法……………………………………………………………………….20 2.5Web使用挖掘方法在个性化学习系统中的应用20 2.5.1改进系统性能21 2.5.2完善站点结构21 2.5.3提供智能化服务21 2.5.4个性化需求设计21 2.6小结21 第三章 基于图结构的Web访问序列挖掘,22 3.1路径分析技术22 3.2图结构模型23 3.3生成最大向前路径……………………………………………………………………...24 3.4挖掘频繁遍历路径25 3.5小结26 第四章 基于认飞b使用挖掘方法的个性化学习系统分析27 4.1学习者访问模式的源数据收集…,27 4.1.1服务器级采集28 4.1.2应用服务器级数据采集30 4.1.3客户级数据采集30 4.1.4代理级数据采集 31 4.2学习者访问模式的数据预处理………………………………………………………...32 4.2.1学习者识别32 4.2.2会话识别34 4.2.3路径修补34 4.2.4事务识别34 4.2.5格式化35 4.3学习者访问模式发现35 4.3.1路径分析35 4.3.2关联规则35 4.3.3序列模式36 4.3.4分类36 4.3.5聚类36 4.4小结36 第五章 总结与展望……………………….………………………………..……………….38 参考文献……………………………………………..………………………………………39 第一章绪论 1.1研究背景与意义 Internet的迅速发展,在给人们带来丰富信息和极大便利的同时,也产生一些急待 解决的问题。个性化信息服务和构建智能化的Web站点便是其中之一。一方面,不同 层次、不同爱好和使用目的的浏览者需要个性化的信息服务;另一方面,Web站点的 经营者和管理者为提高网站的声誉和效益,需要了解客户需要什么和想做什么。 直接或间接地解决这个问题的途径之一就是将数据挖掘技术应用于Web服务器 日志的挖掘。从用户在web上浏览行为的数据中获取用户的行为模式,根据用户 的行为模式改进站点的设计和服务。 如何从海量序列数据集中挖掘出序列模式 (sequentialPattem)是当今科学计算 和商业数据挖掘领域中一个十分重要的研究课题。人类社会的日益电子化使数据集的 数量、种类和规模都在不断增大,数据集的增大导致传统挖掘算法挖掘出的序列模式 大规模增多,因而如何从大量候选集中挖掘出有效序列模式面临着新的挑战。序列输 入数据固有的特性、期望序列模式相关的时间约束 (timingconstrainis)和海量数据集的 结合以及数据仓库多维模

您可能关注的文档

文档评论(0)

wq640326 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档