- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Web挖掘远程教育站点设计
基于Web挖掘远程教育站点设计
摘要:针对传统基于B/S模式的远程教育站点系统中存在的不足,提出将Web挖掘技术用于远程教育站点设计。使用Web挖掘技术发掘学习者的浏览习惯及其学习特点,促进管理员改进网站页面布局及课程设置,借此提升站点综合效益。
关键词关键词:远程站点;Web挖掘;服务器日志;挖掘技术
中图分类号:TP392文献标识码:A文章编号文章编号2014)005013202
作者简介作者简介:张舰(1988-),男,硕士,东南大学教育技术学硕士研究生,研究生方向为网络教育支撑技术与网络安全。0引言
使用现有的J2EE、ASP.NET及PHP等Web开发技术能快捷地构建出基于B/S模式的远程教育站点。基于这些技术开发的站点动态性及可维护性很强,但难以掌握学习者的动向,学习者的个体特性无法把握。本文引入Web挖掘技术,通过挖掘技术发掘服务器日志中隐藏的知识,协助站点管理员作出有针对性的调整,从而使站点更符合学习者的要求。
1远程教育站点
现代远程教育站点是采用多种媒体手段进行远程系统教学的教育形式。它是随着现代信息技术的发展而产生的一种新型教育形式,是构筑知识经济时代人们终身学习体系的主要手段。
B/S模式,即浏览器/服务器结构的远程教育站点摆脱了传统C/S模式的弊端,学习者无需在终端安装插件或其它客户端软件,学习者的一切学习过程均通过浏览器完成。这种模式极大地提高了远程教育的便捷性。同时,基于B/S模式的远程教育能够实现4W(Whoever, Whenever, Wherever, Whatever)学习[2],方便学习者学习。
基于B/S模式的远程教育站点学习资料及其相关数据与服务均存放在服务器端,学习者所在的客户端只需正常连接到Internet便可进行学习。基于B/S模式的远程教育站点系统如下图1所示。图1基于B/S模式的远程教育站点系统模型
2Web挖掘
2.1Web挖掘涵义
Web挖掘是数据挖掘在Web中的应用,它利用数据挖掘技术从与WWW相关资源和行为中抽取感兴趣的、有用的隐含信息,涉及Web技术、数据挖掘、计算机语言学、信息学等多个领域,是一项综合技术。Web内容挖掘是指对Web页面内容及后台交易数据库进行挖掘,从Web文档内容中获取有用知识[3]。
2.2服务器日志
服务器日志是记录Web服务器接收处理请求以及运行错误等各种原始信息的.log文件[2]。通过网站日志可以清楚得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问网站的哪个页面以及是否访问成功。对于从事搜索引擎优化的专业工作者而言,网站日志可以记录各搜索引擎蜘蛛机器人爬行网站的详细情况。例如:哪个IP的百度蜘蛛机器人在哪天访问了网站多少次,访问了哪些页面,以及访问页面时返回的HTTP状态码。
2.3基于Web挖掘的远程教育站点系统模型
该系统模型采用B/S模式系统,通过Web挖掘技术发掘服务器日志(Web blog)中学习者的学习习惯、浏览特点及兴趣点,将发现的隐藏知识反馈给站点管理员,指导其作出相应调整,如置顶信息、热门课程等。添加Web挖掘后的远程教育站点系统模型如图2所示。
图2基于Web挖掘技术的远程教育站点系统模型
相较于传统的基于B/S模式的远程教育站点系统模型,基于Web挖掘技术的远程教育站点系统模型的优点表现在以下3个方面:①反馈更及时、准确。站点管理员能及时发现学习者的浏览习惯,教师能及时掌握课程受欢迎程度及课程点击动态;②发现系统内在联系。通过发掘服务器日志,能找出课程与课程、学习者与课程、学习者学习密集时间段及学习者与课程教师间的潜在联系,有助于课程调整,使其更符合学习者学习习惯;③促进站点分类。依据学习者的学习情况对课程难易程度进行分类。
3Web挖掘远程教育站点
3.1B/S模式站点架构技术
远程站点需要完成的功能包括教学、作业、考试、答疑等。本文中未列出课程费用支付及学习者身份认证模块。
3.2Web挖掘技术
3.2.1服务器数据预处理
服务器日志记录的数据中,相当部分对站点系统无用。因此,在进行Web挖掘之前,需对这些数据进行预处理,包括对日志文件的清理、过滤及转换,从而提取有效数据。首先清除日志文件中的不相关项,保留相关项,去除冗余及干扰信息;其次,分离系统属性及其相关值,经过分离过滤,提高Web挖掘程序的可用性和效率。此外,还需对数据进行分类,将服务器日志如数据分为站点相关数据或站点无关数据。站点无关数据记录学习者的IP、用户名、访问日期及申请的学习服务等;站点相关数据主要记录数据请求方式、对应的数据URL、收发数
文档评论(0)