数据挖掘系统构建及实现.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘系统构建及实现

数据挖掘系统构建及实现摘 要:本文使用SQL Server 2005中的挖数据掘工具,选择Business Intelligence Development Studio模版中的Analysis Services 组件构建数据挖掘方案,运用关联规则数据挖掘结果代替专家经验知识库,结合Visual Studio .Net 2003中的ASP.NET技术完成数据挖掘结果的前台展示。论文对智能自测试系统中的专家经验知识库的构成进行了改进,并实现了数据挖掘与智能自测试系统的集成。 关键词:智能自测试系统;专家经验知识库;关联规则;数据挖掘;Analysis Services 1 引言 智能自测试系统、作业和考试系统都属于计算机辅助教学的范围,在国外已经很流行,国外的Learning Space、Web CT、Top Class,国内的V class、网梯等平台,总体来说,这些系统已经初步具备智能功能[1],能够根据学生考卷或作业信息进行统计分析,以给教师或学生提供参考。只是智能化尚不是很完备,需要进一步改进。 针对当今教学辅助系统智能化不足的问题,本人设计了智能自测试系统辅助教学工作,引入数据挖掘技术,系统根据学生的认知能力和学习情况推荐合适的学习资料,根据学生的学习测试情况提出教学指导建议,获得进适合一步学习的资料,有目的的进行下一步的学习,基于智能的自测试系统越来越受到广大学习者的喜欢[9]。 智能自测试系统可按功能划分成四大模块(如图1-1):学生模型(学生的知识水平和学习能力)、教师模型(教学策略)、知识库(领域知识和数据挖掘)、人机接口(在智能自测试系统和教师及学生之间建立友好的通讯交流方式)。 图1-1 智能自测试系统结构 2、基于数据挖掘的知识库设计 知识库的设计包括领域知识和数据挖掘。领域知识包括领域专业知识和领域专家的经验知识[2]。专家的经验知识库的的组织与设计是一项难于进行的工作,我们不妨考虑将数据挖掘引入经验知识库的设计中来,并利用数据挖掘合适的规律对学生的学习进行指导。 知识库的设计基于的思想是: 系统不仅对每个学生的各项学习能力成绩的进行记录,同时也对每个学生的学习资料进行分析,从而对某一方面的能力不足的同学,将擅长该方面能力的同学的学习资料推荐给该同学,这样就可以使系统为某方面能力不足的同学推荐合适的提高能力的学习资料。 系统采用基于关联规则的挖掘算法,挖掘符合情况要求的资料的项集,然后对挖掘的结果进一步设定限定条件,进行筛选然后推荐给用户,那么为了挖掘需要,我们设计五张存放学习资料和学习记录的表。 (1)教学内容表—KnowledgeNode表,存放教师认为符合教学大纲的教学材料,供学生在线学习,主要包括:知识点编号[11],知识点类型(记忆型,问题求解型,认知策略型),知识点内容,重要程度(选学,一般,重点)和认知程度(1记忆2理解3应用4分析5综合6评价)等。 (2)单次学习标识表(SingleStudyKey) 对学生的一次学习进行标识,以便我们后面区分不同的项集使用,不管学生一次进行多少内容的学习,只要是基于同一知识点的,都认为是同一次学习,单次学习标识表主要包括单次学习资料标识和知识点编号。 (3)学习资料历史记录(StudyMaterialRecord) 为了不使记录表记录冗余信息,把记录表和资料表分开设计。学生在线学习或进行资料下载,对此进行记录,为我们发掘优秀的学习资源提供了数据准备。学习资料历史记录主要字段为:记录流水号,单次学习资料标识,资料编号等。 (4)资料表(Material) 资料表中记录了资料的具体信息,为我们对需要帮助的学生进行相应的学习资料推荐。资料表主要包括如下字段:资料编号,知识点编号,资料名字和侧重认知能力。 (4)学习成绩记录表(ExamRecord),记录每次学生自测的成绩、各项能力的成绩,为后面进行数据挖掘准备数据。表主要包括如下内容,自测试开始时间,知识点编号,用户名,认知能力成绩,理解能力成绩,应用能力成绩,分析能力成绩,综合能力成绩,评价能力成绩和认知能力总成绩。 3、数据预处理 ExamRecord表中记录的是学生对于某一知识点的学习情况,记录中保留了用户的测试成绩,成绩分为单项能力的成绩以及总体的认知能力成绩,那么,我们要想从中发现学生能力的薄弱之处,我们通过SQL语句对其进行预处理,使得我们可以得到学生薄弱能力的编号。主要思想:对记录单项成绩的六个字段相互比较,得出最低成绩,然后设定最低能力成绩对应的能力编号,认知能力编号参考知识点表的定义。 4、建立视图 为方便模型建立,提高查询速度,我们考虑在ExamRecord、SingleStudyKey和Mate

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档