基于医院信息系统的数据挖掘.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医院信息数据仓库的构建 3.1系统设计的背景 广州医科大学附属第四医院创建于2011年,是经广州市政府批准设立、按“三甲”标准建设的大型综合医院,前身是2010年广州亚运会运动员村门诊部。作为一所按“三甲”标准建设的大型综合医院,它走在全国医院信息化建设的前沿。目前医院信息系统涵盖了医院信息系统(HIS)、检验信息系统(LIS)、影像信息系统(PACS)等方面的20多个子系统,涉及医院业务管理、电子病历、经济核算管理等领域,包括门诊、住院、病案、电子病历、技术诊断、合理用药监测等支持基础临床业务的子系统;药库、卫生材料、日用百货、固定资产、医疗设备、供应中心等支持库存生产管理的子系统;人事系统、财务系统、公医系统、办公自动化等支持医院办公功能的子系统;网上挂号、病人随访、服务信息公开、自助查询等支持客户服务的子系统;成本核算、综合查询、卫生统计等支持统计分析决策的子系统。 随着接待的病患数不断增加和医院规模的壮大,各类数据也激增至每天十几万条新纪录的产生速度。面对业务数据库中积累下来的大量的数据资源,在历史数据的使用方面医院信息系统的缺陷慢慢浮现出来了,主要有以下几个方面: 1.对历史数据的分析手段贫乏 医院信息系统对历史数据的分析系统没有建立起来。所有的历史数据都在数据库中处于休眠状态,没有发挥其真正具有的决策支持能力。 2.历史数据逐渐难于管理和访问 由于医院信息系统的信息量的快速增长,业务系统多年运行下来,积累了大量的历史数据,对于大量的历史数据逐渐难于管理和访问。 3.决策需求与统计查询的要求增多 开发人员面临临床科室不断增长的决策需求与统计查询的要求增多,需要不停地开发新的应用程序;作为管理决策人员来说,在应用HIS时会不断有新的查询要求,特别是一些需要查询整年数据的时候,经常会出现查询的时间过长;同一时间临床科室在使用正常业务流程,由于各种数据库都存在的并发问题,会明显感觉到系统的运行效率下降。 4.数据不完整 系统数据库中,由于进行了多次的版本更新和数据库升级。所以数据库中还存在一定程度的数据不完整性。一般来说,新版本的数据库中,一些新增加的字段在以前的数据库是不存在的,因此数据迁移以后,该字段为空值等情况。 因此,为了管理历史数据设计一个数据仓库,然后基于数据仓库进行数据挖掘以及OLAP数据分析是现阶段医院信息化建设的当务之急。 3.2系统总体应用模式 本系统应用模式如图3-1可见: 图3-1 系统应用模式 1.数据源 正如前面提到的,医院数据仓库中的源数据或者称之为历史数据来自于关系数据库、数据文件或其他数据。与此同时,为了能以较少的代价获得这些数据,需要充分考虑源数据的特征。例如,当前在大量的现有系统中均采用了关系数据库管理系统(RDBMS)来管理数据,因此根据基于关系的数据仓库存储、管理方法将是目前非常经济的选择。 2.ETL[] ETL(Extract—Transform—Load的缩写,即数据抽取、转换、装载的过程)能够按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。如果说数据仓库的模型设计是一座大厦的设计蓝图,数据是砖瓦的话,那么ETL就是建设大厦的过程。医院数据仓库要把业务系统中产生的源数据、历史数据抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到医院数据仓库中去。为了能更好地实现ETL,在实施ETL过程中要注意以下几点: (1)如果条件允许,可利用数据中转区对运营数据进行预处理,保证集成与加载的高效性; (2)如果ETL的过程是主动“拉取”,而不是从内部“推送”,其可控性将大为增强; (3)ETL之前应制定流程化的配置管理和标准协议; (4)关键数据标准至关重要。ETL面临的最大挑战是当接收数据时其各源数据的异构性和低质量。以电信为例,A系统按照统计代码管理数据,B系统按照账目数字管理,C系统按照语音ID管理。当ETL需要对这三个系统进行集成以获得对客户的全面视角时,这一过程需要复杂的匹配规则、名称/地址正常化与标准化。而ETL在处理过程中会定义一个关键数据标准,并在此基础上,制定相应的数据接口标准。 3.数据仓库和数据集市 数据仓库按照医院业务流程存储历史数据和事务型数据,数据集市是指从操作的数据和其他的为某种的数据源中收集数据的仓库重点还在于它迎合了专业用户群体的特殊需求,在分析、内容、表现以及易用方面 4.终端用户工具 终端用户工具可以获取数据仓库中的数据信息,主要包括各客户程序、桌面产品和定制的分析工具。通过查询仓库中的数据,挖掘其中的信息,前端的工具分析,并呈现给用户报表等各种形式。 5.元数据 元数据是数据仓库的重要组成部分,是数据仓库的粘合剂,它记录了在数据仓库构建、管理、运行和维护整个

文档评论(0)

学术无戒 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档