24年钉钉杯大数据挑战赛金奖作品B2024072528788.pdfVIP

  • 1
  • 0
  • 约4.6万字
  • 约 41页
  • 2026-07-03 发布于甘肃
  • 举报

24年钉钉杯大数据挑战赛金奖作品B2024072528788.pdf

2024年第三届“钉钉杯”大学生

大数据挑战赛论文

题目结合多种预测模型的门诊收入预测研究

摘要

通过对医院经济收入构成及改变情况的把握,可以实现医院现有资源的科学分配,

引导医院综合水平的提升,实现医院经济效益的增加。本文利用相关机构所提供的数据,

基于机器学习以及集成学习方法对各康复医学科病房对应的门诊收入数据进行分析预

测。

针对问题一与问题二中的康复医学科病房一、二对应的门诊收入数据预测任务,本

文先对原始数据进行了数据的分析与预处理。首先通过正态性检验判断数据是否满足异

常值处理的前提。之后利用箱线图结合3原则进行数据异常值的辨别和筛选,最后通

过min-max归一化使得不同规模和量纲的数据缩放到适合于本次建模的各类模型的数

据接受区间以及范围之内,减少规模、特征、分布差异对模型的影响,保证模型训练的

可学习性。考虑到本次建模的数据量较小,本文采用k折交叉验证的方式来进行模型训

练和验证,提高模型的泛化能力。最后对两个预测任务建立了RF随机森林、XGBoost

支持并行树提升、GBT梯度提升树、SVR支持

文档评论(0)

1亿VIP精品文档

相关文档