数据挖掘在教育信息化中的应用空间分析.docxVIP

数据挖掘在教育信息化中的应用空间分析.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘在教育信息化中的应用空间分析

数据挖掘在教育信息化中的应用空间分析 随着信息社会的来临,大量信息在给人们带来方便的同时也带来了信息的消化、信息的辨识、信息的安全、信息形式的一致性等问题。人们开始考虑:如何才能不被信息淹没,而且从中及时发现有用的知识,提高信息利用率,最终避免“数据爆炸但知识贫乏”的现象。[1]这个任务就落在数据挖掘的身上。本文对教育信息化条件下,数据挖掘的应用空间进行分析,希望能为教育信息化建设提供有价值的参考。? ????一、数据挖掘及其技术? ????1.数据挖掘? ????数据挖掘(Data?Mining)就是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程,是一类深层次的数据分析方法。它是一门交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。数据挖掘技术包括三个主要部分:算法和技术;数据;建模能力。[2]? ????2.数据挖掘系统? ????一个完整的数据挖掘系统包括规则生成子系统和应用评估子系统两个部分。规则生成子系统主要完成根据数据仓库提供的历史数据,统计并产生相关规律,并输出相关结果;应用评估子系统可以理解为系统中的挖掘代理程序,根据生成子系统产生的规则按照一定的策略对数据进行分类预测,通过系统的任务计划对数据产生评估指标。? ????3.数据挖掘的分类? ????数据挖掘的分类方法很多。根据不同挖掘任务,数据挖掘可分为分类或预测模型发现,数据归纳、聚类、关联规则发现,序列模式发现,依赖关系或依赖模型发现,异常和趋势发现等等;根据挖掘方法,可分为机器学习法、统计方法、神经网络方法和数据库方法。其中机器学习法包括:归纳学习方法(决策树、规则归纳等)、基于范例学习、遗传算法等;统计方法包括:回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分析(主元分析法、相关分析法等)等;神经网络分析法包括:前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等;数据库方法主要包括多维数据分析(OLAP)方法。? ????4.数据挖掘过程? ????数据挖掘过程包括对问题的理解和提出、数据收集、数据处理、数据变换、数据挖掘、模式评估、知识表示等过程,以上的过程不是一次完成的,其中某些步骤或者全过程可能要反复进行。? ????对问题的理解和提出:在开始数据挖掘之前,最基础的工作就是理解数据和实际的业务问题,在这个基础之上提出问题,对目标作出明确的定义。? 数据收集:广泛收集用户的各种信息,建立数据库与数据表,为数据挖掘做准备。? ????数据处理:对收集的信息进行如“去噪”等处理,确保数据能够真实反映待要挖掘的对象。? ????数据变换:将经过“去噪”的数据进行一定的格式转换,使其适应数据挖掘系统或挖掘软件的处理要求。? ????数据挖掘:可以单独利用也可以综合利用各种数据挖掘方法对数据进行分析,挖掘用户所需要的各种规则、趋势、类别、模型等。? ????模式评估:对发现的规则、趋势、类别、模型进行评估,从而保证发现的模式的正确性。? ????知识表示:将挖掘结果以可视化的形式展现在用户面前。? ????5.数据挖掘的主要功能? ????概念/类描述、特征化和区分:对每个类的汇总、简洁、精确的描述可以通过数据特征化、数据区分和数据比较来实现。数据特征化是指目标类数据的一般特征或特征的汇总,如一年的成绩汇总;数据区分是将目标类对象的一般特征与一个或多个对比类对象的一般性比较,如A学校和B学校的比较。? ????关联分析:目的在于发现关联规则,这些规则揭示属性与属性值在数据集中一起出现的条件。这种关联规则可以是单维关联规则或多维关联规则。? 分类与预测:利用某种数据挖掘算法的某种规则自动对海量数据进行分类,其间较少有人工干预,目的是为数据挖掘基础上的预测服务。? ????聚类分析:聚类是根据最大化类内的相似性、最小化类间的相似性原则对海量数据进行聚类或分组,从而产生属性相近的各个类。? ????孤立点分析:所谓孤立点,是指数据集合中与多数数据的特征或行为完全不一致的数据。在最初的挖掘算法中,人们总是将孤立点从数据集合中删除,以保证数据的纯洁性。然而,删除孤立点可能会导致忽略某些非常有用的特殊规则,因而对孤立点需作特殊处理。? ????演变分析:可以根据数据的特征对数据的发展变化作出相应的预测与分析。主要应用于对时间序列数据的分析、序列或周期模式匹配和基于类似性的数据分析。[3]? ????二、数据挖掘在教育信息化中的具体应用空间? ????1.学习者特征分析? ????学习者特征由学习者的知识结构和学习风格组成。知识结构说明了学习者对正在或将要学习知识的掌握情况,主要包括学习者初始技能、当前技能和目标技能

文档评论(0)

hhuiws1482 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档