- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要 在许多研究和应用领域,数据呈现海量性、连续性等特点。在这种条件下,
传统的数据处理方法已经难以满足现今社会数据分析的需要。函数型数据的产生
为现代数据分析提供了新的思路,一方面能够有效降低海量数据的存储空间,并
且可以借助函数方法对数据进行有效分析。但是函数型数据的研究发展时间较
短,各种方法还不是很完善。本文就函数型数据的聚类分析,提出分步系统聚类
算法,并对其应用做深入研究。 论文首先阐述了函数型数据分析步骤以及常用的聚类方法。函数型数据聚类
方法大多从数据的实际距离出发进行聚类,没有体现函数型数据的特点,不能充
分利用数据信息。论文针对该问题提出了分步系统聚类算法,给出了函数型数据
距离、均值的定义,详细阐述了分步系统聚类算法的具体步骤:首先,利用函数
型数据间的实际距离进行聚类,然后,利用函数型数据的导函数距离对结果进一
步聚类。为了检验方法的有效性,论文进行随机模拟,并用CR 指数将其和传统
方法进行了比较。最后,论文将函数型数据的聚类算法应用到实证研究,对世界
国家通过人均GDP 进行了划分,将结果同真实划分进行对比。根据函数型数据
的特点,论文结合聚类分析,提出了函数型数据预测的可行方法,并验证该方法
的可行性。 随机模拟和实证研究表明,分步系统聚类算法能够在充分利用数据信息的条
件下,对数据进行有效划分,在实际应用也体现出良好的应用价值。
关键词:函数型数据;聚类分析;系统聚类;分步聚类 ABSTRACT In recent decades, the data in many research and application areas present large
quantity and continuity. The tradition data processing methods have been difficult to
meet the need of data analysis. The generation of functional data provided a new way
to the data in the modern world. The functional data on the one hand can effectively
reduce the amount of the data store space; on the other hand it can make use of
functional methods to process the history data. However, the time of functional data
development is much shorter than others, which cause that its method is not perfect.
This paper presented step-by-step Hierarchical clustering method and made in-depth
study for its application. At first, the paper presented the functional data analysis and the existing
clustering methods. These methods mostly uses distance between data to cluster,
which doesn’t reflect the characteristics of functional data and doesn’t make full use of the information of the data. In order to solve the problem, this paper advanced the
step-by-step Hierarchical clustering method, presented the definition of the mean and
distance of functional data and gave the specific step of the method in detail : cluster
by the distance of functional data at first, and go
文档评论(0)