基于web挖掘的远程教育站点设计精品.docVIP

下载本文档

2
0
约2.81千字
约 6页
2021-04-10 发布于福建
举报
版权申诉

基于web挖掘的远程教育站点设计精品.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第 PAGE 页基于Web挖掘远程教育站点设计　　使用现有J2EE、ASP及PHP等Web开发技术能快捷地构建出基于B/S模式远程教育站点。基于这些技术开发站点动态性及可维护性很强，但难以掌握学习者动向，学习者个体特性无法把握。本文引入Web挖掘技术，通过挖掘技术发掘服务器日志中隐藏知识，协助站点管理员作出有针对性调整，从而使站点更符合学习者要求。　　1远程教育站点　　现代远程教育站点是采用多种媒体手段进行远程系统教学教育形式。它是随着现代信息技术发展而产生一种新型教育形式，是构筑知识经济时代人们终身学习体系主要手段。　　B/S模式，即浏览器/服务器结构远程教育站点摆脱了传统C/S模式弊端，学习者无需在终端安装插件或其它客户端软件，学习者一切学习过程均通过浏览器完成。这种模式极大地提高了远程教育便捷性。同时，基于B/S模式远程教育能够实现4W（Whoever， Whenever， Wherever， Whatever）学习[2]，方便学习者学习。　　基于B/S模式远程教育站点学习资料及其相关数据与服务均存放在服务器端，学习者所在客户端只需正常连接到Internet便可进行学习。基于B/S模式远程教育站点系统如下图1所示。图1基于B/S模式远程教育站点系统模型　　2Web挖掘　　2.1Web挖掘涵义　　Web挖掘是数据挖掘在Web中应用，它利用数据挖掘技术从与WWW相关资源与行为中抽取感兴趣、有用隐含信息，涉及Web技术、数据挖掘、计算机语言学、信息学等多个领域，是一项综合技术。Web内容挖掘是指对Web页面内容及后台交易数据库进行挖掘，从Web文档内容中获取有用知识[3]。　　2.2服务器日志　　服务器日志是记录Web服务器接收处理请求以及运行错误等各种原始信息.log文件[2]。通过网站日志可以清楚得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器情况下访问网站哪个页面以及是否访问成功。对于从事搜索引擎优化专业工作者而言，网站日志可以记录各搜索引擎蜘蛛机器人爬行网站详细情况。例如：哪个IP百度蜘蛛机器人在哪天访问了网站多少次，访问了哪些页面，以及访问页面时返回HTTP状态码。　　2.3基于Web挖掘远程教育站点系统模型　　该系统模型采用B/S模式系统，通过Web挖掘技术发掘服务器日志（Web blog）中学习者学习习惯、浏览特点及兴趣点，将发现隐藏知识反馈给站点管理员，指导其作出相应调整，如置顶信息、热门课程等。添加Web挖掘后远程教育站点系统模型如图2所示。　　图2基于Web挖掘技术远程教育站点系统模型　　相较于传统基于B/S模式远程教育站点系统模型，基于Web挖掘技术远程教育站点系统模型优点表现在以下3个方面：①反馈更及时、准确。站点管理员能及时发现学习者浏览习惯，教师能及时掌握课程受欢迎程度及课程点击动态；②发现系统内在联系。通过发掘服务器日志，能找出课程与课程、学习者与课程、学习者学习密集时间段及学习者与课程教师间潜在联系，有助于课程调整，使其更符合学习者学习习惯；③促进站点分类。依据学习者学习情况对课程难易程度进行分类。　　3Web挖掘远程教育站点　　3.1B/S模式站点架构技术　　远程站点需要完成功能包括教学、作业、考试、答疑等。本文中未列出课程费用支付及学习者身份认证模块。　　3.2Web挖掘技术　　3.2.1服务器数据预处理　　服务器日志记录数据中，相当部分对站点系统无用。因此，在进行Web挖掘之前，需对这些数据进行预处理，包括对日志文件清理、过滤及转换，从而提取有效数据。首先清除日志文件中不相关项，保留相关项，去除冗余及干扰信息；其次，分离系统属性及其相关值，经过分离过滤，提高Web挖掘程序可用性与效率。此外，还需对数据进行分类，将服务器日志如数据分为站点相关数据或站点无关数据。站点无关数据记录学习者IP、用户名、访问日期及申请学习服务等；站点相关数据主要记录数据请求方式、对应数据URL、收发数据量及时长等。如学习者IP及其学习记录属性为站点无关数据；学习者访问数据链接为站点相关数据。　　3.2.2构建Web挖掘DB 　　通过Web挖掘DB主要目是存储经过数据预处理后服务器日志数据，方便后续Web挖掘算法应用。经过数据预处理后得到数据站点相关数据与无关数据。站点无关数据存储在学习者客户端cookies中与服务器端，需要按预处理后保留数据项建立相应表存储站点数据。　　3.2.3Web挖掘过程　　完成上述两项工作后，可以使用Web挖掘程序进行挖掘工作。Web挖掘中应注意两点：①确保DB中数据结构与存储方式适合Web挖掘算法；②Web挖掘算法选取适当，能够发掘出隐藏在数据中未知信息。其过程涉及关联