- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中国广播电视大学沧州分校
大专毕业论文
Web使用挖掘方法及其在个性化学习系统中的应用研究
专业名称:计算机应用
作者名称:张慧娟
学 号:063150193
指导老师:付博明
日期:2008年4月18日
Web使用挖掘方法及其在个性化学习系统中的应用研究
摘要
数据挖掘就是从海量数据的集合中发现有效的、新颖的、有用的、可理解的模式。
Web使用挖掘是数据挖掘技术在Web使用数据上的应用,它的主要任务是研究用户的
浏览行为,发现用户对网页的兴趣度和访问模式,从而可以改进网站结构,为用户提
供个性化服务。
本文的研究内容包括:(l)对web使用挖掘的特点、方法及相关技术分析,指出了
现有Web使用挖掘的数据采集技术的不足;(2)提出一种综合获取用户浏览信息的方
法;(3)讨论基于图结构的Web访问序列模式挖掘方法;(4)提出基于内容过滤和协同过
滤相结合的个性化推荐算法;(5)将Web使用挖掘技术应用于远程学习系统,通过web
使用模式挖掘对学习者访问学习网站和使用学习资源的信息进行挖掘分析,及时了解
学习者的学习需求、学习进度、兴趣爱好,适时推出个性化的学习模式,构建个性化
的网络学习系统。
本文的主要特色:把基于内容过滤的推荐算法和协同过滤的推荐算法相结合;在
传统的学习网站中加入了个性化推荐模块,从而更加适应现代的个性化教育理念。
关键词:数据挖掘;Web使用挖掘;兴趣度;个性化学习推荐
作者:张慧娟
目录
第一章 绪论1
1.1研究背景与意义1
1.2研究内容与论文组织结构2
第二章 Web使用挖掘技术 4
2.1数据挖掘概述 4
2.1.1数据挖掘概念 4
2.1.2数据挖掘方法和技术4
2.1.3数据挖掘过程6
2.2web挖掘技术7
2.3web使用挖掘10
2.3.1Web使用挖掘流程10
2.3.2模式发现算法12
2.4序列模式挖掘13
2.4.1序列模式的提出13
2.4.2序列模式的相关概念及定义13
2.4.3序列模式的主要算法15
APriori算法 15
GSP算法 18
FP一Growth算法19
Prefixspan算法……………………………………………………………………….20
2.5Web使用挖掘方法在个性化学习系统中的应用20
2.5.1改进系统性能21
2.5.2完善站点结构21
2.5.3提供智能化服务21
2.5.4个性化需求设计21
2.6小结21
第三章 基于图结构的Web访问序列挖掘,22
3.1路径分析技术22
3.2图结构模型23
3.3生成最大向前路径……………………………………………………………………...24
3.4挖掘频繁遍历路径25
3.5小结26
第四章 基于认飞b使用挖掘方法的个性化学习系统分析27
4.1学习者访问模式的源数据收集…,27
4.1.1服务器级采集28
4.1.2应用服务器级数据采集30
4.1.3客户级数据采集30
4.1.4代理级数据采集 31
4.2学习者访问模式的数据预处理………………………………………………………...32
4.2.1学习者识别32
4.2.2会话识别34
4.2.3路径修补34
4.2.4事务识别34
4.2.5格式化35
4.3学习者访问模式发现35
4.3.1路径分析35
4.3.2关联规则35
4.3.3序列模式36
4.3.4分类36
4.3.5聚类36
4.4小结36
第五章 总结与展望……………………….………………………………..……………….38
参考文献……………………………………………..………………………………………39
第一章绪论
1.1研究背景与意义
Internet的迅速发展,在给人们带来丰富信息和极大便利的同时,也产生一些急待
解决的问题。个性化信息服务和构建智能化的Web站点便是其中之一。一方面,不同
层次、不同爱好和使用目的的浏览者需要个性化的信息服务;另一方面,Web站点的
经营者和管理者为提高网站的声誉和效益,需要了解客户需要什么和想做什么。
直接或间接地解决这个问题的途径之一就是将数据挖掘技术应用于Web服务器
日志的挖掘。从用户在web上浏览行为的数据中获取用户的行为模式,根据用户
的行为模式改进站点的设计和服务。
如何从海量序列数据集中挖掘出序列模式 (sequentialPattem)是当今科学计算
和商业数据挖掘领域中一个十分重要的研究课题。人类社会的日益电子化使数据集的
数量、种类和规模都在不断增大,数据集的增大导致传统挖掘算法挖掘出的序列模式
大规模增多,因而如何从大量候选集中挖掘出有效序列模式面临着新的挑战。序列输
入数据固有的特性、期望序列模式相关的时间约束 (timingconstrainis)和海量数据集的
结合以及数据仓库多维模
您可能关注的文档
- 2014黑龙江会计从业考试《电算化》考前押密卷(一).pdf
- 2014黑龙江会计从业考试《会计基础》考前押密卷(一).pdf
- 2014届高三化学一轮复习课件 第10章 化学与自然资源开发利用 第二讲 资源综合利用 环境保护.ppt
- 2014届高三数学(理)一轮总复习:第二篇 函数、导数与应用 第11节导数在研究函数中应用 Word版含解析.doc
- 2014年1月财务管理试题 电大专科.pdf
- 2014年广东会计从业考试《财经法规》全真模拟卷(一).pdf
- 2014年柜员等级题库--电子银行部汇总.doc
- 2014年贵州会计从业考试《会计基础》全真模拟卷(一).pdf
- 2014年国标《安规》普考题库(发电厂和变电站电气部分)4.doc
- 2014年海淀区第十届中小学生智能控制(单片机编程)竞赛试题及答案11.docx
最近下载
- 17J008 挡土墙(重力式、衡重式、悬臂式)(最新).pdf VIP
- 2024医院等级评审自评报告.docx VIP
- 2025汇能控股集团内蒙古卓正煤化工有限公司招聘笔试备考题库及答案解析.docx VIP
- 2025年出生缺陷防控培训试题(附答案).docx
- YB-4001.1-2007 钢格栅板及配套件-第1部分:钢格栅板(中文版).docx VIP
- 2019年全国广播电视技术能手竞赛理论试题网络安全(含答案).doc VIP
- 10kv箱式变电站技术要求.doc VIP
- 《模拟电子技术基础教程》华成英第六章习题解答.pdf VIP
- 10KV箱式变电站技术要求.pdf VIP
- 2025年4月高考语文模拟好题:语言文字运用专题(附答案解析).doc VIP
文档评论(0)