数据仓库中的数据清洗.pdfVIP

  • 163
  • 0
  • 约8.05千字
  • 约 7页
  • 2017-08-27 发布于安徽
  • 举报
数据仓库中的数据清洗 ① ② 刘玉 陈金雄 ①福州大学物理与信息工程学院,350002,福州市工业路523号 ②南京军区福州总医院,350025,福州市西二环北路156号 关键词 数据清洗 二次清洗 数据仓库 摘 要 以病种分析为例,介绍了在数据仓库中数据清洗的方法——二次清洗法,二次 清洗完成的工作是不同的,第一次的清洗主要负责清洗源数据中的“脏数据”,第二次清 洗则负责维度的提取。 1 引言 随着时间的发展,医院信息系统中积累了大量的业务数据,越来越多的医院选择建立 数据仓库以提取其中有用的信息,用于分析和决策。病种分析就是当前比较热门的主题, 可以通过病种分析主题考察单病种的治愈质量、平均费用、平均住院日及单病种的病人构 成情况,有利于单病种的合理限价,提高医院的竞争力。病种分析的星型结构见图1。病 种分析中涉及到众多的数据,数据的准确与否直接关系着决策质量的好坏。为了能够准确 的决策,必须对进入数据仓库的数据进行清洗。 事实表

文档评论(0)

1亿VIP精品文档

相关文档