聚类分析论文-我国管理科学与工程博士学位论文的共词聚类分析 .docVIP

下载本文档

1
0
约4.66千字
约 9页
2018-05-24 发布于江苏
举报
版权申诉

聚类分析论文-我国管理科学与工程博士学位论文的共词聚类分析 .doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

聚类分析论文-我国管理科学与工程博士学位论文的共词聚类分析

聚类分析论文:我国管理科学与工程博士学位论文的共词聚类分析 -工程论文聚类分析论文:我国管理科学与工程博士学位论文的共词聚类分析内容摘要：本文利用《CNKI中国博士学位论文全文数据库》中收录的4537篇管理科学与工程专业博士学位论文，以其中的高频关键词为研究对象，对能反映学科研究热点的高频关键词进行共词聚类分析，研究各高频关键词之间的内在关系，探索管理科学与工程专业博士学位论文研究现状、热点和变化趋势等，以期对今后的研究有所助益。　　关键词：管理科学与工程学位论文共词分析聚类分析　　　　问题的提出　　管理科学与工程是综合运用系统科学、管理科学、数学、经济和行为科学及工程方法，结合信息技术研究解决社会、经济、工程等方面的管理问题的一门学科。该学科研究广泛的内容和丰富的研究方法使得研究领域不断扩展，新技术、新思想的不断融入为学科的发展提供了广阔的空间。因此，关注该管理科学与工程学科的研究热点是十分必要的。　　博士学位论文的主题和内容展现出作者深厚的理论功底和卓越的见解，这是因为博士论文的选题新颖，论文的内容信息量大并且专业性强，既有研究的深度又有研究的广度，具有较高的学术价值。在衡量学科发展水平和科技产出的指标时，学者经常以博士学位论文的发表状况作为参考和衡量依据，其研究内容可以反应出该学科近期的发展趋势和研究热点。本文采用共词聚类分析法，对CNKI中收录的我国管理科学与工程专业的博士学位论文进行定量分析，通过数据研究与分析，找出我国管理科学与工程领域的博士研究生所关注的研究热点。　　共词分析法是一种内容分析的方法，主要是通过对能够表达某一学科领域研究主题或研究方向的专业术语共同出现在一篇文献中的现象的分析，判断学科领域中主题间的关系，从而展现该学科的研究内容与结构。其立论的假设条件是：文章的关键词是文章主题内容的浓缩，共词文章数量越多，表明这类关键词距离就越近，利用现代的多元统计技术如因子分析、聚类分析和多维尺度分析等，则可以按这种距离将一个学科内的重要关键词加以分类，从而分析出该学科领域的研究现状与内容。　　数据来源　　《CNKI中国博士学位论文全文数据库》（简称CDFC）是目前国内相关资源最完备、质量最高、出版周期最短、数据最规范、最实用、连续动态更新的博士学位论文全文数据库。　　本文选择中国知网的《CNKI中国博士学位论文全文数据库》的免费题录数据库，于2011年9月9日为时间截点，以学科专业名称作为检索途径，输入管理科学与工程作为检索词，共检索到4537篇博士学位论文。　　用Excel和ROST内容挖掘工具对检索结果进行文本合并与数据统计，共得到23564个关键词，人工反复进行校对，剔除了对反应主题没有积极意义的决策、现状、影响因素、模型等高频词，最后选择词频数大于等于20的高频关键词共得到68个，如表1高频关键词所示。　　数据分析　　（一）构建共词矩阵　　表1中统计的这些关键词是管理科学与工程专业博士学位论文中出现频次较高的词，它们在较大程度上反映出当前该学科博士研究生在管理科学与工程学科领域的研究热点，但是由于许多相关知识和其他热点会与这一研究热点有交叉，并且不同的学者在研究的过程中对关键词的把握也会存在一定的差异，因此，我们需要预处理得到的这些高频关键词，从而进一步反映这些关键词之间的关系。　　根据表1中的统计数据，对68个关键词两两配对，统计它们在4537篇文献中共同出现的频次，形成6868的矩阵，如表2所示。　　（二）构建相关矩阵　　为了消除关键词词频悬殊造成的影响，利用SPSS 19.0对共词矩阵进行相关分析，得到相关矩阵（见表3），相关矩阵的数据很重要，它是后面进行聚类分析的基础数据。　　（三）利用spss进行聚类分析　　将表3所示的相关矩阵导入SPSS19.0进行层次聚类分析，选择组间平均链锁（Between-group link-age），即个体与小类中每个个体距离的平均值。此种方法利用了个体与小类的所有距离的信息，克服了极端值造成的影响。得到的凝聚状态表，如表4所示。　　在表4中，第一列（阶）表示聚类分析的第几步；第二、三列表示本步聚类中哪两个样本或小类聚成一列；第四列（系数）是个体距离或小类距离；第五、六列表示本步聚类中参与聚类的是个体还是小类，0表示样本，非零表示由第几步聚类生成的小类参与本步聚类；第七列表示本步聚类的结果将在以下第几步中用到。例如，第一步中，53号关键词（风险控制）与68号关键词（风险评估）聚成一类，它们的个体距离是0.997，这个小类将在第12步中用到。同理可得其它聚类。这个聚类可以从图1所示树状图中展现出来　　层次聚类分析的树状图是以躺倒树的形式展示了聚类分析中的每一次类的聚合情况。SPSS重新调整距离进行聚类合并，