24年钉钉杯大数据挑战赛金奖作品B2024053128247.pdfVIP

  • 0
  • 0
  • 约4.01万字
  • 约 28页
  • 2026-07-03 发布于甘肃
  • 举报

24年钉钉杯大数据挑战赛金奖作品B2024053128247.pdf

2024年第三届“钉钉杯”大学生

大数据挑战赛论文

题目基于K-means聚类和层次聚类的医疗门诊数据分析

摘要

随着智慧医疗的普及,先进的信息技术被广泛地应用于医疗健康领域,以提高医

疗服务的效率、质量和可及性。如何准确地对医疗门诊数据进行分类,在资源配置、

风险管理、政策制定等方面具有重大意义。针对此问题,本文分析了某医院2023年至

2024年的相关医疗数据,使用K-means聚类和层次聚类对医疗门诊数据进行聚类,建

立了多元线性线性回归模型,对聚类结果作出了详细的分析。

针对问题一:首先我们对数据进行预处理,通过散点图可知数据在一定范围内波动,

并由箱型图得出数据中只有少量的异常值,可以认为是特殊情况下形成的结果。考虑到

特征变量的完整性,因此我们将题目所给的所有变量都作为能够描述不同科室、不同

日期下的指标。首先我们将原始数据进行Z-score标准化,目的是消除量纲影响和改善

8

聚类效果,并通过肘部法则和轮廓系数决定聚类数为,随后引入随

文档评论(0)

1亿VIP精品文档

相关文档