24年钉钉杯大数据挑战赛金奖作品B2024070828425.pdfVIP

  • 0
  • 0
  • 约10.65万字
  • 约 69页
  • 2026-07-03 发布于甘肃
  • 举报

24年钉钉杯大数据挑战赛金奖作品B2024070828425.pdf

2024年第三届“钉钉杯”大学生

大数据挑战赛论文

题目基于多种机器学习模型的医院门诊收入预测

摘要

智慧医疗建设是新质生产力在卫生健康领域的着力点,新质生产力是助力智慧医疗

建设的重要手段。通过建立一个智慧的医疗信息网络平台,患者可以以更低的成本和更

短的等待时间享受到安全、便捷、高质量的医疗服务。本文针对某医院近些年门诊医疗

数据进行大数据挖掘和分析,并对门诊收入缺失值进行时间序列内插。

首先,本文对题目所给2071条医院门诊数据进行探索性数据分析(EDA)。由于

该数据系时间序列,有较强的周期性、季节性,本文对门诊收入进行全面多角度的时间

序列分析,包括年、月、周、日、季节、节假日和波峰波谷的特征分析。分析发现,门

诊收入以周为周期进行波动,周一或工作日首天多为收入峰值,周四附近为收入低谷;

此外,门诊收入受节假日影响较大,尤其春节假期期间收入通常为全年低谷。

然后,结合EDA结果进行一系列特征工程处理。针对时间戳序列,构建是否为节

假日、是否为周一等布尔特征,构建距离节假日天数、距离工作日天数等时间差特

文档评论(0)

1亿VIP精品文档

相关文档