图形图像处理识别技术与医学信息分析-实验1 医院数据进仓清洗与整理 医院数据挖掘与分析实验.docVIP

图形图像处理识别技术与医学信息分析-实验1 医院数据进仓清洗与整理 医院数据挖掘与分析实验.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图形图像处理识别技术与医学信息分析-实验1 医院数据进仓清洗与整理 医院数据挖掘与分析实验

实验1 医院数据进仓、清洗和整理 一、实验目的 1. 学习如何将分离的医院数据导入数据仓库,并清洗和整理; 2. 认识数据挖掘的预处理工作的作用。 二、实验环境 1. 将“实验1”文件夹复制到本地某一硬盘上,如:D盘。该文件夹含有Excel数据文件ghk1.xls、ghk2.xls和ghk3.xls,以及databasemodal文件夹(内含med_data.mdf和med_data_log.LDF空数据库文件,供实验1使用); 2.Microsoft SQL Server 2005 Analysis Services (SSAS) 运行环境; 3.Excel工作环境。 三、实验内容 1. 将3个含有挂号信息的Excel数据表(ghk1.xls、ghk2.xls和ghk3.xls)导入到SQL数据库med_data的ghk表中。 (1)进入SQL Server 企业管理器工作环境,将med_data数据库附加到当前LOCAL组内; 参考步骤:①单击“开始”→“程序”→“Microsoft SQL Server 2005” →“SQL Server Management Studio”,进入SQL Server 企业管理器工作环境; ②在“对象资源管理器”浏览窗格中,右击“数据库”→在快捷菜单上的“附加”,如图9-10(a)所示; ③在“附加数据库对话框”内,单击“添加”,选择数据库存放目录和数据源文件名→单击“确定”,如图9-10(b)所示 (2)打开med_data已建立的数据表GHK,将一个含有挂号信息的Excel数据表导入到该表中,为信息提取作好数据准备。 参考步骤:右击med_data数据库,在快捷菜单中选择“任务/导入数据”,启动导入向导,单击[下一步]→选择数据源(Microsoft Excel), 进行Excel连接设置(文件路径及文件名,如ghk1.xls、ghk2.xls和ghk3.xls,Excel版本),单击[下一步]→选择目标、服务器名称、数据库(Med_data),单击[下一步]→选择“复制一个或多个表或视图的数据”,单击[下一步],选择源表和源视图,选择或输入目标(本例输入“[med_data].[dbo].[ghk]”),单击[下一步]→选择“立即执行”, 单击[下一步]→单击[完成]。 注意:①Excel表中数据的类型必须与SQL Server数据表内数据的类型一致;②由于Excel表每张表最多只有65536行数据,所以需要导入数张表,比较费时,建议省略不练习此步,直接加载一含有144156行数据记录的Med_data数据库,直接进行下面的操作。 2. 生成一备份的数据库表。 参考步骤:①新建一med_bak数据库;②右击med_data数据库,在快捷菜单中选择“任务/导出数据”,启动导入向导,单击[下一步]→选择数据源(SQL Native Client)、服务器名称和数据库med_data,单击[下一步]→选择目标、服务器名称、数据库Med_bak,单击[下一步]→选择“复制一个或多个表或视图的数据”,单击[下一步],选择源表和源视图,选择或输入目标(如图9-11所示),单击[下一步]→选择“立即执行”, 单击[下一步]→单击[完成]。 3. 在ghk表中删除与主题分析无关的数据列,如: BLANK1—BLANK10。 参考步骤:①在对象资源管理器中,右击med_data数据库中要修改的表ghk,在快捷菜单中选择“修改”,打开表设计器; ②选择要删除的列,右击该列,然后从快捷菜单中选择“删除列”,关闭表设计器,保存对表的修改。 4. 在GHK新增“GHWeek”列,从“GHRQ”字段中提取挂号日期的星期信息,使用SQL语句:update GHK set GHWeek=datename(weekday,GHRQ) 参考步骤:①右击GHK表,选择“修改”→在表结构中增加“GHWeek”(数据类型:nvarchar(10))→单击“保存”,如图9-12所示; ②右击已打开的GHK表,在快捷菜单中选择“窗格/SQL”(或单击工具栏上的[显示SQL窗格]按钮),打开“SQL编辑器”→输入“update GHK set GHWeek=datename(weekday,GHRQ)”→单击“执行”,如图9-13所示; 注意:如果发现服务器处理超时的提示,请选择“工具/选项”在对话框中选择“设计器项目”重新设置超时时间。 四、实验思考 1.对数据表ghk中的数据进一步整理,删除HY、WHCD、JTDH数据列。 2.对数据表中的数据进一步分析,例如分离出挂号时段信息,据此可以进行重新挖掘 实验2 医院数据的数据挖掘 一、实验目的 1. 掌握MS SQL Server 2005环境下,对医院数据进行信息挖掘的

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档