改进模糊K―Prototypes聚类算法在研究生培养质量评估中应用.docVIP

改进模糊K―Prototypes聚类算法在研究生培养质量评估中应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
改进模糊K―Prototypes聚类算法在研究生培养质量评估中应用

改进模糊K―Prototypes聚类算法在研究生培养质量评估中应用   [摘 要] 研究生教育在从追求招生数量到重视培养质量的背景下,如何有效而准确地评估研究生培养质量,成为当前各高校面临的重要课题。文章提出一种改进的模糊K-Prototypes聚类算法,可准确分析研究生培养质量情况。该算法首先提取相应的研究生培养质量影响因素属性,构建研究生培养质量评估指标,从而形成分析数据集;其次,为了解决研究生培养数据密度不均的问题,提出改进算法;最后利用改进的聚类算法对分析数据集进行聚类分析。以一所具体高校为例,验证提出算法的有效性和改进后聚类效果,为科学有效的研究生培养质量评估提供辅助决策方法支持。   [关键词] 研究生教育; 培养质量评估; 模糊K-Prototypes聚类   doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 07. 077   [中图分类号] G647 [文献标识码] A [文章编号] 1673 - 0194(2018)07- 0185- 06   1 引 言   提高研究生培养质量是高等教育改革最核心的任务[1],而如何对培养质量进行客观科学的评估则是任务的难点所在。一些学者进行了探索性研究,对高校研究生培养质量评估,采用了主成分分析方法、层次分析评价模型、模糊综合评价模型等传统方法,如Chen等人在文献[2]中提出了改进的层次分析方法构建的教育质量评价模型的理论与应用; Liu等人在文献[3]中采用层次分析及模糊的方法对研究生培养质量评估中学生综合职业能力方面的评价作了研究;Hu等人在文献中提出用主成分分析和Elman神经网络对研究生培养质量中关于教学质量方面的评估进行了研究。这些文献分别提出基于模糊综合评价的高等职业教育评价模型和基于模糊综合评价法的高等工程教育综合评估研究。上述方法有其积极有效的一面,但一般通过专家为评估对象打分,评估结果主观性较强,往往不能较好反映实际值。   针对研究生培养质量数据类型多样化及数据具有模糊边界特征的特点,将模糊K-Prototypes聚类算法应用于研究生培养质量评估中,同时,由于研究生培养质量数据呈现密度不均现象,提出了改进的模糊K-Prototypes聚类算法,采用密度与最大最小距离方法以及高密度点的方法,将数据集划分成不同的密度区域,从而得到数值属性与分类属性的初始聚类中心,以此提高聚类结果的准确性。以武汉理工大学2015级研究生培养质量相关的数据集为实验数据,对其进行聚类分析,获得关于影响研究生培养质量的主要因素,从而为研究生培养质量评估提供有效的决策支持方法。   2 研究生培养质量评估指标   武汉理工大学的研究生教育综合管理系统经过多年系统性建设,涵盖了研究生从入学到毕业整个培养过程信息,是研究生培养质量聚类分析的基础。该系统数据库包含了学生的学籍、课业、学术论文发表、科研、指导教师基本信息及其论文发表、科研项目、科研成果等详细数据,而不同属性之间又可能存在关联性,特征属性的选取,将直接影?聚类结果。考虑到本文的目标是对研究生培养质量数据进行聚类分析,参考已有文献研究成果,影响研究生培养质量的主要因素,包括研究生的分析能力、创造力、实践能力、综合能力、科研成果情况、学习成绩、学位论文情况、导师因素、学术氛围环境等。   基于上述特征属性集,结合武汉理工大学对于研究生培养质量评估的实际需求,本文构建了如下多因素多层次的研究生培养质量评估指标体系。   本文将基于改进模糊K-Prototypes聚类算法构建研究生培养质量聚类分析模型,本研究将所评估指标作为模型的输入变量,对研究生培养质量进行聚类分析,从中获取每类研究生培养质量的整体特征,进而发现影响研究生培养质量的主要影响因素。   3 模糊K-prototypes 聚类算法   假设混合属性数据集为X={X1,X2,…,Xn},其中有n个样本数据,每个样本数据有m个属性,则混合属性集合中的每个样本数据可以记为Xi={x■■x■■,…,x■■,x■■,…,x■■},前p个属性表示数值型数据,后m-p个属性表示分类型数据。   定义1相异度度量:假定X与Y表示两个样本,则数值属性的相异度与分类属性相异度计算公式分别为式(1)和式(3)。   对于数值型属性,采用传统的方法欧氏距离来计算,则两个样本相异度定义如下:   d1(Xi,Yj)=■(c■■-x■■)2,1≤r≤p(1)   对于分类型属性,采用海明距离来计算两个样本的相异度定义为:   ?啄(x■■-y■■)=0,x■■=y■■1,x■■≠y■■(2)   d2(Xi,Yj)=■?啄(x■■-y■■),p+1≤r≤m(3)   则每个样本数据间的相异度计算方法定义

您可能关注的文档

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档