网站大量收购独家精品文档,联系QQ:2885784924

基于系统聚类法对中学教育进行研究参考.doc

基于系统聚类法对中学教育进行研究参考.doc

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于系统聚类法对中学教育进行研究参考

基于系统聚类法对中学教育进行研究 摘要 目前全国中学已经系统地设置了,教学方法与目前学生的性心理和生理发育格格不入教育教学比较符合前中学学生的认知水平,能较好地提高课堂教学效果,缩短与教学目的之间的距离不断的探索形式和内容学生管理是学校教育的重要组成部分,清晰认识学生自身特点是对学生实施有针对性管理的前提。 关键词:中学教育 系统聚类法 样品间距 类间距 学生成绩 一、背景分析 本文列出一实验学校各个年级的学生在中期考试、期末考试中的成绩表,s1-s4依次表示7年级阶段各次半期和期末考试的成绩; e1-e4依次表示8年级阶段各次半期和期末考试的成绩;n1依次表示9年级阶段第一次月考的成绩。数据保存在文件st-grades.xls中,数据格式如表所列。 为了方便班主任的管理和各个任课老师教学的方便,需要对该班学生的成绩进行分类,再将各个类别人员的变动情况进行比较,方便老师了解该同学的学习的动态状况,以便老师结合其实际情况对其指导教学,促进学生的学习,为学生中考做好准备。根据资料自主选择时间,变量,样本进行多元统计分析。 本文将根据这4个主要变量的观测数据,6种不同方法,利用系统聚类法,以七年级学生的成绩为代表,进行聚类分析。 二、聚类分析简介 2.1系统聚类法的基本原理 先假定各个样品各自成一类,这时各类间的距离就是各样品之间的距离,将距离最近的两类合并成一个新的类;再计算新类与其它类间的距离,将距离最近的两类合并,如此每次缩小一类,直至所有的样品都成为一类为止。然后根据需要或者根据给出的距离临界值(阈值)确定分类数及最终要分的类。 设有n个样品,每个样品测得p项指标(变量),原始资料阵为 其中为第i个样品的第j个指标的观测数据。第i个样品Xi为矩阵X的第i行所描述,所以任何两个样品XK与XL之间的相似性,可以通过矩阵X中的第K行与第L行的相似程度来刻划;任何两个变量与之间的相似性,可以通过第K列与第L列的相似程度来刻划。 如果把n个样品(X中的n个行)看成p维空间中n个点,则两个样品间相似程度可用p维空间中两点的距离来度量。 2.2 距离 2.2.1常用的距离 假设有两个p维样本, (1)欧氏距离 (2)标准化欧氏距离 这里D表示n个样本的方差矩阵,表示第j列的方差。 (3)布洛克距离(绝对距离) (4)闵可夫斯基(Minkowski)距离 注:当q=1时是布洛克距离(绝对距离);当q=2时是欧氏距离。当各变量的测量值相差悬殊时,要用明氏距离并不合理,常需要先对数据标准化,然后用标准化后的数据计算距离。 为弥补闵可夫斯基(Minkowski)距离的不足之处,平衡各个指标对欧氏距离的贡献,提高结果的正确率。因此一个合理的做法,就是对坐标加权,这就产生了“统计距离”。比如设,,且Q的坐标是固定的,点P的坐标相互独立地变化。用s11,s12,…,spp表示p个变量的n次观测的样本方差,则可以定义P到Q的统计距离为: 所加的权是,即用样本方差除相应坐标。当取 时,就是点P到原点O的距离。若时,就是欧氏距离。 (5)马氏(Mahalanobis)距离 马氏距离是由印度统计学家马哈拉诺比斯于1936年引入的,故称为马氏距离。这一距离在多元统计分析中起着十分重要的作用。 假设共有p个指标,第i个指标共测得m个数据(要求mn) , 于是,得到阶的数据矩阵,每一行是一个样本数据。阶的数据矩阵的阶协方差矩阵记作,其中 , 如果存在,则两个样品之间的马氏距离为 马氏距离既排除了各指标之间相关性的干扰,而且还不受各指标量纲的影响。除此之外,它还有一些优点,如可以证明,将原数据作一线性交换后,马氏距离仍不变等等。 (6)相似距离(Correlation distance) 2.3六种系统聚类法 正如样品之间的距离可以有不同的定义方法一样,类与类之间的距离也有各种定义。例如可以定义类与类之间的距离为两类之间最近样品的距离,或者定义为两类之间最远样品的距离,也可以定义为两类重心之间的距离等等。类与类之间用不同的方法定义距离,就产生了不同的系统聚类方法。本节介绍常用的八种系统聚类方法,即最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、离差平方和法。系统聚类分析尽管方法很多,但归类的步骤基本上是一样的,所不同的仅是类与类之间的距离有不同的定义方法,从而得到不同的计算距离的公式。这些公式在形式上不大一样,但最后可将它们统一为一个公式,对上机计算带来很大的方便,详见后。以下用表示样品与之间距离,用表示类与之间的距离。 1.最短距离法 定义类与之间的距离为两类最近样品的距离,即 设类与合并成一个新类记为,则任一类与的距离是: 最短距离法聚类的步骤如下: 1)定

文档评论(0)

feixiang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档