- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图形图像处理识别技术与医学信息分析-实验1 医院数据进仓清洗与整理 医院数据挖掘与分析实验
实验1 医院数据进仓、清洗和整理
一、实验目的
1. 学习如何将分离的医院数据导入数据仓库,并清洗和整理;
2. 认识数据挖掘的预处理工作的作用。
二、实验环境
1. 将“实验1”文件夹复制到本地某一硬盘上,如:D盘。该文件夹含有Excel数据文件ghk1.xls、ghk2.xls和ghk3.xls,以及databasemodal文件夹(内含med_data.mdf和med_data_log.LDF空数据库文件,供实验1使用);
2.Microsoft SQL Server 2005 Analysis Services (SSAS) 运行环境;
3.Excel工作环境。
三、实验内容
1. 将3个含有挂号信息的Excel数据表(ghk1.xls、ghk2.xls和ghk3.xls)导入到SQL数据库med_data的ghk表中。
(1)进入SQL Server 企业管理器工作环境,将med_data数据库附加到当前LOCAL组内;
参考步骤:①单击“开始”→“程序”→“Microsoft SQL Server 2005” →“SQL Server Management Studio”,进入SQL Server 企业管理器工作环境;
②在“对象资源管理器”浏览窗格中,右击“数据库”→在快捷菜单上的“附加”,如图9-10(a)所示;
③在“附加数据库对话框”内,单击“添加”,选择数据库存放目录和数据源文件名→单击“确定”,如图9-10(b)所示
(2)打开med_data已建立的数据表GHK,将一个含有挂号信息的Excel数据表导入到该表中,为信息提取作好数据准备。
参考步骤:右击med_data数据库,在快捷菜单中选择“任务/导入数据”,启动导入向导,单击[下一步]→选择数据源(Microsoft Excel), 进行Excel连接设置(文件路径及文件名,如ghk1.xls、ghk2.xls和ghk3.xls,Excel版本),单击[下一步]→选择目标、服务器名称、数据库(Med_data),单击[下一步]→选择“复制一个或多个表或视图的数据”,单击[下一步],选择源表和源视图,选择或输入目标(本例输入“[med_data].[dbo].[ghk]”),单击[下一步]→选择“立即执行”, 单击[下一步]→单击[完成]。
注意:①Excel表中数据的类型必须与SQL Server数据表内数据的类型一致;②由于Excel表每张表最多只有65536行数据,所以需要导入数张表,比较费时,建议省略不练习此步,直接加载一含有144156行数据记录的Med_data数据库,直接进行下面的操作。
2. 生成一备份的数据库表。
参考步骤:①新建一med_bak数据库;②右击med_data数据库,在快捷菜单中选择“任务/导出数据”,启动导入向导,单击[下一步]→选择数据源(SQL Native Client)、服务器名称和数据库med_data,单击[下一步]→选择目标、服务器名称、数据库Med_bak,单击[下一步]→选择“复制一个或多个表或视图的数据”,单击[下一步],选择源表和源视图,选择或输入目标(如图9-11所示),单击[下一步]→选择“立即执行”, 单击[下一步]→单击[完成]。
3. 在ghk表中删除与主题分析无关的数据列,如: BLANK1—BLANK10。
参考步骤:①在对象资源管理器中,右击med_data数据库中要修改的表ghk,在快捷菜单中选择“修改”,打开表设计器;
②选择要删除的列,右击该列,然后从快捷菜单中选择“删除列”,关闭表设计器,保存对表的修改。
4. 在GHK新增“GHWeek”列,从“GHRQ”字段中提取挂号日期的星期信息,使用SQL语句:update GHK set GHWeek=datename(weekday,GHRQ)
参考步骤:①右击GHK表,选择“修改”→在表结构中增加“GHWeek”(数据类型:nvarchar(10))→单击“保存”,如图9-12所示;
②右击已打开的GHK表,在快捷菜单中选择“窗格/SQL”(或单击工具栏上的[显示SQL窗格]按钮),打开“SQL编辑器”→输入“update GHK set GHWeek=datename(weekday,GHRQ)”→单击“执行”,如图9-13所示;
注意:如果发现服务器处理超时的提示,请选择“工具/选项”在对话框中选择“设计器项目”重新设置超时时间。
四、实验思考
1.对数据表ghk中的数据进一步整理,删除HY、WHCD、JTDH数据列。
2.对数据表中的数据进一步分析,例如分离出挂号时段信息,据此可以进行重新挖掘
实验2 医院数据的数据挖掘
一、实验目的
1. 掌握MS SQL Server 2005环境下,对医院数据进行信息挖掘的
您可能关注的文档
最近下载
- 2023年06月国家国防科技工业局核技术支持中心社会招考聘用笔试历年难、易错考点试题含答案解析.docx
- 人教版七年级上册英语单词表2115.pdf VIP
- 台达 VFDB4132系列刹车模块说明书.pdf
- 河南省郑州市外国语学校2025-2026学年高三上学期第三次阶段检测语文试题(含答案及解析).docx VIP
- 中国马克思主义与当代知到智慧树期末考试答案题库2024年秋北京工业大学.docx VIP
- 2024最新不予立案通知书.doc VIP
- 工业网络技术教材PPT10 Modbus TCP通信及应用.pptx VIP
- 2025年中国亚克力镜面板市场调查研究报告.docx
- 账号内容打造方案.docx VIP
- 锋芒全系列笔记低吸有道系统课程.pdf VIP
原创力文档


文档评论(0)