- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Web数据挖掘个性化学习系统研究
基于Web数据挖掘个性化学习系统研究
摘 要: 结合Web数据挖掘在E-learning平台中的应用,分析了Web数据挖掘的基本过程与关键技术,提出了一种基于Web挖掘的个性化学习平台模型,并阐述了Web挖掘在平台中的应用及其个性化搜索引擎的实现。
关键词: E-learning应用平台; Web数据挖掘; 个性化学习; 个性化搜索引擎
中图分类号:TP392;G434 文献标志码:A 文章编号:1006-8228(2013)09-05-03
0 引言
计算机通信技术的日益强大支撑了建设学习型社会的需求,远程教育借助它的灵活性与选择性渐渐走进人们身边,成为学习的一种普遍方式。自1996年我国开通了“中国教育与科研计算机网”,开放、灵活的E-learning便迅速被人们所接受并应用于各种网络学校和远程教育之中。
随着时间的推移,人们要求不仅仅只是远距离的教学,更多的是个性化的学习。个性化教育理论认为,学习过程应是针对学生个性特点和发展潜能而采取恰当的方法、手段、内容、起点、进程、评价方式等,促使学生各方面获得充分、自由、和谐发展的过程[1]。但是目前的远程教育学习系统并不令人满意,首先是系统缺乏智能性,学习系统面对的用户并非是一类人,而是不同背景、不同目的、不同时期的一系列请求,面对这些请求,缺乏智能化的系统就难以实现因材施教;其次是缺乏有效的监督机制和有效的学习帮助支持,导致学生偏离学习目标、遇到困难时不能及时得到帮助;再者是有用的教学资源没有被有效利用,造成了资源的极大浪费。“以人为本”的教育理念的逐渐普及,个性化学习方案总体上应该做到学习资源的多维性、学习价值追求的多重性、学习风格的独特性、学习过程的终身性和学习方式的自主性。
基于Web智能的网络教育是现代远程教育的一种重要手段,其可以通过网络来营造虚拟的学习环境,在一个平台上向学生提供丰富的学习资源,从而帮助学生开展基于资源的探究式学习;在虚拟的学习环境中,教师和学生、学生与学生间可以方便地进行同步或异步的交互。数据挖掘便是实现Web智能网络教育的重要方法,主要是通过获取学习者在Web上的学习过程行为数据,如访问信息、时间、次数及喜好等,经过挖掘流程处理,得到学习者的模式规律,从而给学习者提供良好的个性化服务[2]。
1 Web数据挖掘相关分析
1.1 Web数据挖掘基本过程
Web是一个强大的交互环境,所以Web事务度量就需要数据的获取与处理,Web数据挖掘指的是从大量的、不完全的、蕴含的、模糊的WWW资源上提取隐含在其中有用的信息和知识的过程。其处理对象是大量的业务数据,目的是为了提取有价值的知识,提高信息利用率。Web数据挖掘又被称为资料探勘或者数据采矿,是数据库知识发现中的一个步骤。根据大量业务数据的不同类型,Web数据挖掘可以分为:Web内容挖掘、Web结构挖掘、Web使用挖掘[3]。其中,Web内容挖掘是挖掘Internet的页面和后台交易数据库,包括结构化的数据挖掘与非结构化的数据挖掘。无论是哪种数据挖掘,都是为了寻找隐藏着的、大量的、有价值的信息,并且为Web提供更好的服务。
以下给出Web数据挖掘的基本流程。
⑴ 目标数据采集:数据采集就是要记录用户访问行为。数据来源包括服务器端、客户端和代理端。为了有效地实施挖掘算法,仅仅采集数据是不够的,还需要进行下一步操作:预处理。
⑵ 预处理:目标数据经过预处理才能有效的实施挖掘算法,也就是从目标数据集中除去明显错误数据和冗余的数据,进一步精简所选数据的有效部分,并将数据转化为有效形式。数据的预处理的质量与Web挖掘的效率是紧密相关的。内容包括数据净化、用户识别、会话识别、事务识别及路径补充等。
⑶ 模式发现与分析:模式发现就是对预处理后的数据实施具体的、合理的挖掘算法或综合应用不同的算法。其最终目的是发现用户的访问模式,预先为用户设定学习内容类别。模式分析的目的是根据实际应用,通过观察和选择,将模式发现的统计结果、规则和模型转换为知识,经过筛选后用来指导实际应用,也就是在预先的类别中再次为用户提供个性化资源和学习支持服务。
⑷ 用户反馈:利用数据挖掘与学习内容绑定等各种技术,学习者的学习过程会是以可视化方式进行指导。
1.2 相关算法分析
协同过滤这一概念最早出现在1992年,由Goldberg、Nicols、Oki及Terry提出,随着大大小小系统的应用,协同过滤推荐迅速成为Web数据挖掘中一种很受欢迎的技术。该技术分析用户兴趣,在用户群中找到指定用户的相似用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测[4-6]。
相似性计算是协同过滤推荐算法中最关键的一步,传统
文档评论(0)