- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Web数据挖掘技术在远程教育中应用
Web数据挖掘技术在远程教育中应用摘要: 数据挖掘技术为针对学习者个性差异提供差异性教学安排提供技术支持。从数据挖掘技术的概念入手,分析数据挖掘技术在远程教育的常用方法,初步探讨现代远程教育中Web 数据挖掘技术的应用问题。
Abstract: Data mining technology provides technical support for the difference teaching arrangement to learners’ individual differences. Starting from the concept of data mining technology, this paper analyzes the common method of data mining technology in distance education, and discusses the problems in the application.
关键词: 远程教育;数据挖掘;教育管理
Key words: distance education;data mining;education management
中图分类号:TP274 文献标识码:A 文章编号:1006-4311(2012)20-0217-02
0 引言
随着社会的向前发展,新知识、新技能不断涌出,终身学习是当今社会发展的必然趋势。远程教育是开放的教育系统,它具有资源全球化、教材多样化,管理自动化、环境虚拟化、教学个性化等特点,能够为各类社会成员提供多层次、多样化的教育服务。将Web数据挖掘技术应用于远程教育的教学及管理,根据远程教育的载体教育网站中关于访问者的信息资源,运用数据挖掘技术搜集分析各种数据的相互关系,可以发现大量的数据背后的一些有用知识,运用这些知识有助于及时发现教学与管理中的问题,增加管理工作的针对性,从众多的学习者的访问记录中提取其行为信息,从而指导网站建设,解决现代远程教育信息资源的获取、收集、整理、分类等难题,也有助于针对学习者的个性差异,提供不同的教学内容,提高我国远程教育的质量。
1 数据挖掘技术介绍
1.1 数据挖掘和Web数据挖掘 数据挖掘 (Data Mining)就是从大量的数据中,抽取出潜在的、有价值的信息,提取隐含在其中的、人们事先不知道的、但又有用信息和知识的过程,这个过程包括数据收集、数据处理、数据变换、数据挖掘、模式评估、知识表示等。 Web数据挖掘是将web的使用与传统的数据挖掘结合起来,来获取web知识的过程,是从与WWW相关的资源和行为的一个大型数据仓库中提取隐藏预测信息并发现有用模式、轮廓和趋势的过程。Web数据挖掘根据挖掘的对象不同可以分为Web内容挖掘、Web结构挖掘、Web访问记录挖掘。Web内容挖掘是指对Web页面内容及后台交易数据库进行挖掘,从文件内容及其描述信息中获取有用知识的过程。Web结构挖掘是从人为的链接结构中获取有用的知识,可以对页面进行排序,发现重要的内容页面,重新组织内容结构,使内容逻辑结构更加合理。Web访问记录挖掘主要通过挖掘相应站点的Web日志文件,获取学习者的访问内容、停留时间、访问频度等。帮助管理者了解用户的行为和Web站点结构,为用户提供个性化服务。
1.2 Web数据挖掘的方法 数据挖掘的方法较多,以下几种技术比较适应于远程教育中。
1.2.1 关联规则挖掘:关联规则描述的是数据库中数据项之间的相互联系,其目的就是为了挖掘出隐藏在数据间的相互关系。Web关联规则挖掘就是发现关系密切的页面,通过网站各页面之间的关系预测远程教育学习者要访问的下一个页面,有利于调整远程教育网站的Web站点结构,减少用户浏览和下载的时间。
1.2.2 分类:根据某个分类器将数据对象划分到给定的几个类别中的某一个中,在Web访问械挖掘中,利用学习所获得的模型对未知类别的数据对象进行类别预测主要将一个新注册的学习者分类到某一组用户类中,有针对性地为学习者提供不同的服务。
1.2.3 Web日志的聚类算法:聚类分析是把具有相似特征的用户或数据项归类,在网站管理中按照不同程度具有相似浏览行为的用户分成不相同的一些分组。基于模糊理论的Web页面聚类算法与客户群体聚类算法的模糊聚类相同,客户访问情况可用URL(Uj)表示。有Suj={(Ci,fSuj(Ci))|Ci∈C},其中fSuj(Ci)→[0,1]是客户Ci和URL(Uj)间的关联度:式中m为客户的数量,hits(Ci)表示客户Ci访问URL(Uj)的次数。利用Suj和模糊理论中的相似度度量Sfij定义建立模糊相似矩阵,再根据相似类[Xi]R的定义构造相似类,合并相似类中的公共元素得到的等价
文档评论(0)