虚拟学习社区中学习资源自动生成系统设计与实现.docVIP

下载本文档

2
0
约3.85千字
约 9页
2018-09-19 发布于福建
举报
版权申诉

虚拟学习社区中学习资源自动生成系统设计与实现.doc

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

虚拟学习社区中学习资源自动生成系统设计与实现

虚拟学习社区中学习资源自动生成系统设计与实现　　摘要:基于认知灵活性理论设计的学习资源自动生成系统,可以有效提高虚拟学习社区(VLC)中学习资源的更新速度。本文对虚拟学习社区相关原理、学习资源自动生成系统的设计理念以及关键技术的实现都做了详细介绍。该系统由Web信息采集、信息处理和信息发布三个子系统组成,能实现网络资源的聚合推送功能,促进资源的显性化,有利于协作学习的开展。　　关键词:虚拟学习社区(VLC);学习资源;自动生成　　中图分类号:G420 文献标识码:B文章编号:1673-8454(2010)09-0045-03 　　　　一、引言　　在虚拟学习社区(Virtual Learning Community,VLC)中,学习者往往需要获取大量最新的学习资源来满足自主学习的需要,但是,如果这些资源单纯依靠学习者自主上传和管理员人工上传,会使学习资源更新效率低下,学习者不能及时得到自己所需的资源,致使学习者学习兴趣降低,甚至离开学习社区,严重影响学习效果。因此在虚拟学习社区中设计一种基于Web的学习资源自动生成系统,实现学习资源个性化订阅和信息聚合,具有一定的现实意义。　　二、系统设计概述　　1.设计理念　　学习资源自动生成系统是基于认知灵活性理论而设计的。认知灵活性理论认为人的学习是学习者主动建构内部心理表征的过程,既反对对知识的预先界定,又反对只强调知识的非结构,主张一方面要提供建构理解所需的基础,另一方面又要留给学习者广阔的建构空间,让他们针对具体情境采取适当策略。　　虚拟学习社区是一个网络学习环境,同时也是高度开放的信息生态系统,需要外界源源不断地输入信息,才能保证信息生态平衡,满足不同学习者的学习需要。而网络信息资源虽然十分丰富,但高度分散、结构复杂,是不良结构的知识,这些知识在给学习者提供丰富的学习资源的同时也存在检索困难等问题,有的学习者甚至在信息搜索过程中就偏离了原来的学习目标。[1]因此,利用学习资源自动生成系统,只需一次性订阅,就可以实现网络中提供订阅功能的信息被自动推送到虚拟学习社区中,并能实现按照学习者的定制进行简单的重新构建,形成学习者理解所需的基础知识环境,同时也留给学习者广阔的构建空间。　　2.系统架构　　虚拟学习社区中的学习资源自动生成系统是基于Web架构,由Web信息采集子系统、信息处理子系统和信息发布子系统三部分组成,三个子系统可以单独部署和运行,也可以通过它们之间定义的接口实现整个过程的自动化采集、智能化处理和主动式发布。它们之间的关系如图1所示。　　采集子系统是学习资源自动生成系统的基础模块,由任务管理模块触发实现对特定URL页面信息的采集,然后将采集回来的信息传递给信息处理子系统。信息处理子系统是系统的核心模块,也是系统实现中技术难点最多的模块。它接收采集子系统采集回来的信息,对这些信息进行去噪处理、HTML解析、URL解析、数据解析等处理,最终将这些信息保存到采集数据库中供信息发布子系统使用。信息发布子系统则对保存在采集数据库中的数据进行发布处理和自动摘要等处理后,最终将采集的信息在相应的系统平台中发布。具体工作流程如图2所示。　　3.工作原理分析　　(1)资源采集子系统工作原理　　资源采集有两种方式,第一种方式是通过RSS方式对目标资源进行订阅。第二种方式是通过自行编写资源采集模块实现对目标资源的采集。第一种方式要求目标资源必须提供订阅源,但是目前国内大部分优秀的资源网站并没有实现这样的功能,因此笔者是通过第二种方式进行资源采集的。　　第二种方式实质上就是Web信息提取技术,早在1998年Hobbs就提出了一个信息提取系统的通用体系结构,他还将信息提取系统抽象为“级联的转换器或模块集合,增加新的结构信息”[6]。但是笔者在研究了大量的Web信息提取技术后发现,利用该技术进行资源采集最大的问题就是:99.9%的网站都是过时的[2]。也就是说很难设计实现一种通用的资源提取模块,因此笔者在资源采集子系统的实现中采用基于正则表达式的方法对目标资源进行匹配提取。　　(2)信息处理子系统工作原理　　经过资源采集子系统采集回来的资源往往不适合直接发布在虚拟学习社区中,正如Hobbs所说的,我们还需要为提取回来的信息增加新的结构信息,这就是信息处理子系统的工作原理。　　该子系统的主要工作是对提取的信息进行去噪处理,提取页面信息中的导航栏、页眉、页脚等关键信息。[3]再经过HTML解析后,会由URL解析模块解析出信息中包含的所有URL信息,并且进行URL去重处理,保存在URL库中供采集模块使用。同时,由将处理后的数据保存到采集数据库中以备信息发布子系统使用,完成采集信息到采集数据的转换。[4] 　　(3)个性化信息