在线教学系统中Web使用挖掘技术应用.docVIP

下载本文档

1
0
约5.21千字
约 11页
2018-05-25 发布于福建
举报
版权申诉

在线教学系统中Web使用挖掘技术应用.doc

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

在线教学系统中Web使用挖掘技术应用

在线教学系统中Web使用挖掘技术应用　　摘要: 本文提出应用Web使用挖掘技术对在线教学系统中学生访问行为、频度、内容、停留时间等进行分析,得到学生访问行为和方式的一般模式来指导教学,进行资源推荐、改善教学服务,可以提高学习效率、增强教学效果,提高在线教学系统的个性化服务水平,为系统的决策分析提供智能的辅助手段。　　关键词: 在线教学系统个性化智能化 Web使用挖掘　　　　一、引言　　随着Internet应用的快速发展,以及教育大众化和终身化的需求,通过网络向学生提供形式多样的学习模式,可以实现在不同地点实时地、交互地和有选择地进行学习,具有资源共享、系统开放等优点的在线教学系统就成为现代远程教育的重要研究课题之一。　　在线教学系统的核心是开放、互动、智能和自适应。本文介绍的Web使用挖掘应用于在线教学系统,可以在海量的Web访问数据中发现学生站点浏览模式,不断完善知识点间的关联规则;可以结合学生特征库和学习行为记录挖掘学生对知识点的理解程度,以便智能推荐后继课程和学习资料;也可以及时反馈学生学习进度,使教师及时调整教学要点、教学内容和教学方法[1][2],是实现在线教学系统个性化、智能化的一种重要技术手段。　　二、Web使用挖掘技术　　数据挖掘应用于Internet时,常被称为“Web挖掘”,是一个从大型数据仓库中提取隐藏预测信息和发现有用模式、轮廓和趋势的过程。Etzioni将Web挖掘定义为“从Web文档和服务中自动发现和提取有用信息的一种数据挖掘使用技术”。[3]一般分为Web内容挖掘、Web结构挖掘和Web使用挖掘。在线教学系统中,Web使用挖掘的主要任务是通过对学生访问内容、访问频率、停留时间等进行分析,得出学生访问行为和方式的一般模式,并以此为依据向学生提供全面的个性化、智能化在线教学指导。和其它数据挖掘一样,Web使用挖掘也需要经过数据采集、数据预处理、模式发现和模式分析等过程,如图1所示。　　(一)数据采集　　数据采集就是要记录用户访问行为。一般包括服务器端的数据采集、客户端的数据采集和代理端的数据采集。原始数据需要经过处理后才能有效实施挖掘算法,所以需要进行数据预处理。 ??　(二)数据预处理　　数据预处理的质量与Web挖掘的效率和结果紧密相关,其内容包括:数据清洗、用户识别、会话识别、事务识别和路径补充等。　　(三)模式识别　　模式识别是对预处理后的数据实施挖掘算法。模式识别的基本方法有:统计分析、关联规则、序列模式、频繁访问组、依赖建模等。为了提高数据分析的有效性和准确性,通常会根据待分析数据的不同特征综合采用上述几种挖掘算法。　　(四)模式分析　　模式分析的目的是根据实际应用,利用可视化技术、联机分析技术和智能查询机制等方法和工具对挖掘出来的模式规则进行分析,找出我们感兴趣的模式和规则[4]。对于挖掘出的规则和模式的兴趣常采用兴趣函数来度量。　　三、在线教学系统中Web使用挖掘技术的应用　　在线教学系统中应用Web使用挖掘即在学生访问系统后留下的使用记录中实施数据挖掘,发现和提取有用的信息,其体系结构如图2所示。Web使用挖掘的主要数据源是学生访问记录即学生访问系统在服务器端存留的Web访问日志,包括学生个人的详细信息、访问的时间频率、访问的时间段、停留时间、访问行为等数据。这些数据将在经过预处理后,在专用的数据挖掘模块中,通过具体的挖掘算法来进行模式识别。数据挖掘的结果将存放在数据挖掘结果集中,由专门的模式分析模块对其进行筛选。　　(一)数据预处理过程　　这里的预处理过程主要是针对系统的Web访问日志,是Web使用挖掘过程中最关键的一环,预处理的质量直接关系到后面挖掘过程和模式分析过程的质量。　　1.数据清洗。删除Web日志中与数据挖掘不相关的冗余项。Web日志记录学生IP地址、学生ID、学生请求访问的URL页面、请求方法、访问时间、传输协议、传输的字节数和错误代码等属性,而与数据挖掘相关的只有学生IP地址、学生ID、学生请求访问的URL页面及访问时间等,其它属性可以去掉。　　2.用户识别。包括如何在海量数据中找出属于同一学生的记录;如何在学生访问时识别该学生,迅速找出对应该学生的挖掘结果和推荐集。由于本地缓存防火墙和代理的存在给用户识别带来了困难,常采用基于日志/站点的方法及其它一些启发性规则用于识别用户。　　3.会话识别。将学生访问信息按照一定的时间段进行划分,每一时间段内的学生访问集合作为一个用户会话。会话识别的意义在于可以将不同时间段内的学生访问区分开,而不致于将时间间隔很长的两次访问看作一次。在时间区段较大的Web服务器日志中,用户有可能多次访问该站点。会话识别的目的就是将用户的访问记录划分成