- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘在职校普通话等级考试成绩分析中的应用 答辩人:年爱华 时 间:2010-11-20 导 师:陈晓云 教授 一、论文研究的背景 主要 工作 具体 工作 总结 致谢 研究 背景 普通话测试数据成为我校普通话普及和推广的丰富资源。而本文抽取本校学生的相关数据,将数据仓库和数据挖掘技术合理的应用于普通话等级成绩的分析研究中。 220条 2007年 1320条 504条 298条 普通话测试数据 2010年 2009年 2008年 兰州文科学校普通话测试人数: 二、主要研究工作 研究 背景 具体 工作 主要 工作 2.1数据仓库的建立及数据的展现 2.2使用 Microsoft 决策树创建数据挖掘模型一 2.3使用 Microsoft 聚集创建数据挖掘模型二 2.4改进的Apriori算法 2.6挖掘关联规则模型二 2.5挖掘关联规则模型一 致谢 总结 2.1数据仓库的建立及数据的展现 研究 背景 具体 工作 学 号 姓 名 名 族 PS等级 所学专业 学生表 维表 学 号 教师号 学年学期 课程号 课程成绩 学生成绩表 事实表 教师号 教师名 职 称 学 历 年 龄 教师表 维表 课程表 维表 课程号 课程名称 课程类别 学 年 学年学期 时间表 维表 普通话等级分析数据仓库逻辑模型 致谢 主要 工作 总结 2.1数据仓库的建立及数据的展现 研究 背景 利用DTS(数据转换服务)功能将student.dbc文件导入到SQL Server 2000中,而student.dbc是一个数据库文件,其中已经包括了sc(学生成绩表)、stu(学生表)、course(课程表)、teacher(教师表)、time(时间表)。 具体 工作 致谢 主要 工作 总结 2.1数据仓库的建立及数据的展现 研究 背景 建立多维数据集及数据的展现 excel数据透视表数据显示 excel数据透视图柱形图显示 图5-12 excel数据透视图折线图显示 结论:从以上图表可以看出,普通话等级为一乙时,在同年级中语文的平均成绩也最高,英语成绩在二年级中是最高的;普通话等级越低时,语文的平均成绩也越低;这说明普通话等级成绩与语文基础课程是息息相关的。在此基础上,下面将通过数据挖掘技术对普通话等级成绩进行更深层次的分析。 具体 工作 致谢 主要 工作 总结 2.2使用 Microsoft 决策树创建 OLAP 数据挖掘模型一 研究 背景 Microsoft决策树算法:该算法基于分类。算法建立一个决策树,用于按照事实数据表中的一些列来预测其他列的值。决策树是一种类似于流程图的树结构,构建决策树的关键所在就是如何选择合适的测试属性,本论文以兰州文科学校普通话等级成绩作为测试数据,建立决策树需要考虑分析的户籍类别、年级、专业等属性对普通话等级的总体影响。使用“Microsoft 决策树”算法在学生群中找出普通话等级成绩在校的分布情况。 具体 工作 致谢 主要 工作 总结 2.2使用 Microsoft 决策树创建 OLAP 数据挖掘模型一 研究 背景 户籍为农村的学生有73.10%的可能性获得二乙;只有12.87%的可能性获得二甲;0.58%的可能性获得一乙。 户籍为城市的学生有52.36%的可能性获得二乙;有40.00%的可能性获得二甲;3.64%的学生获得一乙 在数据中,还能分析到旅游专业的学生获得一乙的可能性为30%,而其他专业的学生获得一乙的可能性为1.92%,所以注重旅游专业学生的普通话培训,更能有效的提高学生获得一乙的可能性;并分析旅游专业的课程设置及学生成绩等影响普通话等级的因素,其它专业可以作为借鉴,提高学生普通话的等级。 具体 工作 致谢 主要 工作 总结 2.3使用 Microsoft 聚集创建 OLAP 数据挖掘模型二 研究 背景 Microsoft聚集算法:该算法将记录组合到可以表示类似的、可预测的特征的聚集中。通常这些特征可能是隐含或非直观的。使用该模型将普通话测试按等级划分为五个类别。将学生数据设置为要调查的维度(事例维度),通过算法分析户籍为城的三个年级数据的分布情况,户籍为农的三个年级数据的分布情况。 具体 工作 致谢 主要 工作 总结 2.3使用 Microsoft 聚集创建 OLAP 数据挖掘模型二 研究 背景 一乙 0.44% 二甲 20.65% 二乙 57.68% 三年级 59.67% 农村 45.74% 城市 54.26% cluster5 一乙 0.51% 二甲 63.35% 二乙 33.45% 二年级 57.88% 三年级 34.62% 城市 85.75% cluster4 一乙 0.45% 二甲 28.16%
文档评论(0)