基于Web数据挖掘个性化学习系统研究.docVIP

下载本文档

5
0
约5.48千字
约 12页
2018-06-23 发布于福建
举报
版权申诉

基于Web数据挖掘个性化学习系统研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Web数据挖掘个性化学习系统研究

基于Web数据挖掘个性化学习系统研究　　摘要：结合Web数据挖掘在E-learning平台中的应用，分析了Web数据挖掘的基本过程与关键技术，提出了一种基于Web挖掘的个性化学习平台模型，并阐述了Web挖掘在平台中的应用及其个性化搜索引擎的实现。　　关键词： E-learning应用平台； Web数据挖掘；个性化学习；个性化搜索引擎　　中图分类号：TP392；G434 文献标志码：A 文章编号：1006-8228（2013）09-05-03 　　0 引言　　计算机通信技术的日益强大支撑了建设学习型社会的需求，远程教育借助它的灵活性与选择性渐渐走进人们身边，成为学习的一种普遍方式。自1996年我国开通了“中国教育与科研计算机网”，开放、灵活的E-learning便迅速被人们所接受并应用于各种网络学校和远程教育之中。　　随着时间的推移，人们要求不仅仅只是远距离的教学，更多的是个性化的学习。个性化教育理论认为，学习过程应是针对学生个性特点和发展潜能而采取恰当的方法、手段、内容、起点、进程、评价方式等，促使学生各方面获得充分、自由、和谐发展的过程[1]。但是目前的远程教育学习系统并不令人满意，首先是系统缺乏智能性，学习系统面对的用户并非是一类人，而是不同背景、不同目的、不同时期的一系列请求，面对这些请求，缺乏智能化的系统就难以实现因材施教；其次是缺乏有效的监督机制和有效的学习帮助支持，导致学生偏离学习目标、遇到困难时不能及时得到帮助；再者是有用的教学资源没有被有效利用，造成了资源的极大浪费。“以人为本”的教育理念的逐渐普及，个性化学习方案总体上应该做到学习资源的多维性、学习价值追求的多重性、学习风格的独特性、学习过程的终身性和学习方式的自主性。　　基于Web智能的网络教育是现代远程教育的一种重要手段，其可以通过网络来营造虚拟的学习环境，在一个平台上向学生提供丰富的学习资源，从而帮助学生开展基于资源的探究式学习；在虚拟的学习环境中，教师和学生、学生与学生间可以方便地进行同步或异步的交互。数据挖掘便是实现Web智能网络教育的重要方法，主要是通过获取学习者在Web上的学习过程行为数据，如访问信息、时间、次数及喜好等，经过挖掘流程处理，得到学习者的模式规律，从而给学习者提供良好的个性化服务[2]。　　1 Web数据挖掘相关分析　　1.1 Web数据挖掘基本过程　　Web是一个强大的交互环境，所以Web事务度量就需要数据的获取与处理，Web数据挖掘指的是从大量的、不完全的、蕴含的、模糊的WWW资源上提取隐含在其中有用的信息和知识的过程。其处理对象是大量的业务数据，目的是为了提取有价值的知识，提高信息利用率。Web数据挖掘又被称为资料探勘或者数据采矿，是数据库知识发现中的一个步骤。根据大量业务数据的不同类型，Web数据挖掘可以分为：Web内容挖掘、Web结构挖掘、Web使用挖掘[3]。其中，Web内容挖掘是挖掘Internet的页面和后台交易数据库，包括结构化的数据挖掘与非结构化的数据挖掘。无论是哪种数据挖掘，都是为了寻找隐藏着的、大量的、有价值的信息，并且为Web提供更好的服务。　　以下给出Web数据挖掘的基本流程。　　⑴ 目标数据采集：数据采集就是要记录用户访问行为。数据来源包括服务器端、客户端和代理端。为了有效地实施挖掘算法，仅仅采集数据是不够的，还需要进行下一步操作：预处理。　　⑵ 预处理：目标数据经过预处理才能有效的实施挖掘算法，也就是从目标数据集中除去明显错误数据和冗余的数据，进一步精简所选数据的有效部分，并将数据转化为有效形式。数据的预处理的质量与Web挖掘的效率是紧密相关的。内容包括数据净化、用户识别、会话识别、事务识别及路径补充等。　　⑶ 模式发现与分析：模式发现就是对预处理后的数据实施具体的、合理的挖掘算法或综合应用不同的算法。其最终目的是发现用户的访问模式，预先为用户设定学习内容类别。模式分析的目的是根据实际应用，通过观察和选择，将模式发现的统计结果、规则和模型转换为知识，经过筛选后用来指导实际应用，也就是在预先的类别中再次为用户提供个性化资源和学习支持服务。　　⑷ 用户反馈：利用数据挖掘与学习内容绑定等各种技术，学习者的学习过程会是以可视化方式进行指导。　　1.2 相关算法分析　　协同过滤这一概念最早出现在1992年，由Goldberg、Nicols、Oki及Terry提出，随着大大小小系统的应用，协同过滤推荐迅速成为Web数据挖掘中一种很受欢迎的技术。该技术分析用户兴趣，在用户群中找到指定用户的相似用户，综合这些相似用户对某一信息的评价，形成系统对该指定用户对此信息的喜好程度预测[4-6]。　　相似性计算是协同过滤推荐算法中最关键的一步，传统