- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 PAGE 页
基于Web挖掘远程教育站点设计
使用现有J2EE、ASP及PHP等Web开发技术能快捷地构建出基于B/S模式远程教育站点。基于这些技术开发站点动态性及可维护性很强,但难以掌握学习者动向,学习者个体特性无法把握。本文引入Web挖掘技术,通过挖掘技术发掘服务器日志中隐藏知识,协助站点管理员作出有针对性调整,从而使站点更符合学习者要求。
1远程教育站点
现代远程教育站点是采用多种媒体手段进行远程系统教学教育形式。它是随着现代信息技术发展而产生一种新型教育形式,是构筑知识经济时代人们终身学习体系主要手段。
B/S模式,即浏览器/服务器结构远程教育站点摆脱了传统C/S模式弊端,学习者无需在终端安装插件或其它客户端软件,学习者一切学习过程均通过浏览器完成。这种模式极大地提高了远程教育便捷性。同时,基于B/S模式远程教育能够实现4W(Whoever, Whenever, Wherever, Whatever)学习[2],方便学习者学习。
基于B/S模式远程教育站点学习资料及其相关数据与服务均存放在服务器端,学习者所在客户端只需正常连接到Internet便可进行学习。基于B/S模式远程教育站点系统如下图1所示。图1基于B/S模式远程教育站点系统模型
2Web挖掘
2.1Web挖掘涵义
Web挖掘是数据挖掘在Web中应用,它利用数据挖掘技术从与WWW相关资源与行为中抽取感兴趣、有用隐含信息,涉及Web技术、数据挖掘、计算机语言学、信息学等多个领域,是一项综合技术。Web内容挖掘是指对Web页面内容及后台交易数据库进行挖掘,从Web文档内容中获取有用知识[3]。
2.2服务器日志
服务器日志是记录Web服务器接收处理请求以及运行错误等各种原始信息.log文件[2]。通过网站日志可以清楚得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器情况下访问网站哪个页面以及是否访问成功。对于从事搜索引擎优化专业工作者而言,网站日志可以记录各搜索引擎蜘蛛机器人爬行网站详细情况。例如:哪个IP百度蜘蛛机器人在哪天访问了网站多少次,访问了哪些页面,以及访问页面时返回HTTP状态码。
2.3基于Web挖掘远程教育站点系统模型
该系统模型采用B/S模式系统,通过Web挖掘技术发掘服务器日志(Web blog)中学习者学习习惯、浏览特点及兴趣点,将发现隐藏知识反馈给站点管理员,指导其作出相应调整,如置顶信息、热门课程等。添加Web挖掘后远程教育站点系统模型如图2所示。
图2基于Web挖掘技术远程教育站点系统模型
相较于传统基于B/S模式远程教育站点系统模型,基于Web挖掘技术远程教育站点系统模型优点表现在以下3个方面:①反馈更及时、准确。站点管理员能及时发现学习者浏览习惯,教师能及时掌握课程受欢迎程度及课程点击动态;②发现系统内在联系。通过发掘服务器日志,能找出课程与课程、学习者与课程、学习者学习密集时间段及学习者与课程教师间潜在联系,有助于课程调整,使其更符合学习者学习习惯;③促进站点分类。依据学习者学习情况对课程难易程度进行分类。
3Web挖掘远程教育站点
3.1B/S模式站点架构技术
远程站点需要完成功能包括教学、作业、考试、答疑等。本文中未列出课程费用支付及学习者身份认证模块。
3.2Web挖掘技术
3.2.1服务器数据预处理
服务器日志记录数据中,相当部分对站点系统无用。因此,在进行Web挖掘之前,需对这些数据进行预处理,包括对日志文件清理、过滤及转换,从而提取有效数据。首先清除日志文件中不相关项,保留相关项,去除冗余及干扰信息;其次,分离系统属性及其相关值,经过分离过滤,提高Web挖掘程序可用性与效率。此外,还需对数据进行分类,将服务器日志如数据分为站点相关数据或站点无关数据。站点无关数据记录学习者IP、用户名、访问日期及申请学习服务等;站点相关数据主要记录数据请求方式、对应数据URL、收发数据量及时长等。如学习者IP及其学习记录属性为站点无关数据;学习者访问数据链接为站点相关数据。
3.2.2构建Web挖掘DB
通过Web挖掘DB主要目是存储经过数据预处理后服务器日志数据,方便后续Web挖掘算法应用。经过数据预处理后得到数据站点相关数据与无关数据。站点无关数据存储在学习者客户端cookies中与服务器端,需要按预处理后保留数据项建立相应表存储站点数据。
3.2.3Web挖掘过程
完成上述两项工作后,可以使用Web挖掘程序进行挖掘工作。Web挖掘中应注意两点:①确保DB中数据结构与存储方式适合Web挖掘算法;②Web挖掘算法选取适当,能够发掘出隐藏在数据中未知信息。其过程涉及关联
您可能关注的文档
最近下载
- TXEEPIA 001-2023 重点行业企业项目碳排放评价技术规范.pdf VIP
- 2025年人教版三年级上册道德与法治全册知识点(新教材).pdf
- 海燕出版社六年度级劳动与技术上册教案.pdf VIP
- TCWEC29-2021水利水电工程清污机制造安装及验收规范(OCR).pdf VIP
- 第8课《回忆鲁迅先生》课件 (共45张ppt) 2025-2026学年统编版语文八年级上册.pptx VIP
- 初中美术折纸教学课件.ppt VIP
- 爱护公物,从我做起 主题班会课件(共30张PPT).pptx VIP
- 第二单元 单元复习课件七年级语文上册.ppt VIP
- 2025年广东高职高考语文试卷及答案.doc VIP
- 小马宝莉英文第四季台词S04E18 Maud Pie.pdf VIP
原创力文档


文档评论(0)