- 255
- 0
- 约3.06千字
- 约 7页
- 2020-10-06 发布于浙江
- 举报
实验四 数据挖掘实验指导
目的
掌握数据挖掘工具Clementine的基本方法与操作。
任务
利用Clementine对药物数据进行简单的数据挖掘操作,熟悉数据挖掘的基本步骤。
要求
了解数据挖掘的基本步骤,完成针对给定数据的决策树挖掘/关联规则分析/聚类分析,并写出实验报告。
实验内容
利用Clementine对Drug.txt中药物研究数据进行决策树、关联规则分析,观察挖掘的结果,比较这些方法挖掘结果的异同,根据观察的结果写出实验报告。
注:药物研究数据来源于对治疗同一疾病病人的处方,这些病人服用不同药物,取得了相同效果。其中所含数据项如下:
Age: 年龄
Sex: 性别(M\F)
Drug: 病人所服药物种类(A/B/C/X/Y)
BP: 血压(High\Normal\Low)
Cholesterol: 胆固醇(Normal\High)
Na: 唾液中钠元素含量
K: 唾液中钾元素含量
希望通过数据挖掘发现这些处方中隐藏的规律,给出不同临床特征病人更适合服务哪种药物的建议,为未来医生填写处方提供参考。
实验环境
硬件:P4/256MB台式计算机
软件:Windows 2000 Professional/SQL Server 2000/Clementine 8.1及以上
数据:Drugs数据 (文件Drug.txt)
步骤
启动clementine
双击桌面数据挖掘工具“clementine 8.1” 图标或C:\Clementine 8.1\bin\Clementine.exe,即可启动该挖掘工具,界面如图4-1所示。
主工作区结果输出区
主工作区
结果输出区
挖掘工具区
图4-1 clementine操作界面
数据挖掘操作
挖掘流(stream)操作
新建:File菜单?New Stream命令
保存/另存:File菜单?Save Stream /Save Stream As…命令?指定保存位置、文件名称?保存按钮
打开:File菜单?Open Stream…命令?指定要打开流的位置、文件名称?打开按钮
挖掘步骤
(1)建立连接数据源
1)在挖掘工具区选项卡“Sources”中将“Var. File”节点拖入到主工作区。
2)右击该节点,选择“Edit”命令,并选择“File”选项卡,显示如图4-2所示界面
图4-2 数据源编辑器
3)指定数据来源的文件名,设定源数据存放格式(如是否从文件中读取字段名、数据分隔符号、…)
4)如需要对数据进行过滤则可在图4-2界面中选择“Filter”选卡;如需要对数据类型进行转换则可在图4-2界面中选择“Types”选卡。
设置完后,单击“OK”/“Apply”按钮,完成数据源连接。
(2)指定挖掘模型
在挖掘工具区中选择“Modeling”选卡,将合适的挖掘模型拖到主工作区(如C5.0)。
(3)将数据源与挖掘模型连接起来
右击主工作区中所建立的数据源,选择“Connect…”命令,再单击要与该数据源连接的挖掘模型。
(4)设置挖掘模型
右击主工作区中的挖掘模型,选择“Edit”命令,如图4-3所示。
图4-3 挖掘模型设置
选择“Fields”选项卡,选择“Use custom settings”,并通过下拉菜单,选择“Target”和“Inputs”数据列,单击“OK”关闭对话框。选择“Model”选卡可设置模型名称、输出类型等,选择“Costs”选卡则可设置训练的代价。
(4)执行挖掘
执行挖掘流中的所有挖掘模型,可单击窗口上侧工具栏中按钮“Execute the current stream”;只执行指定挖掘模型,则先单击相应模型,再单击窗口上侧工具栏按钮“Execute selection”。
浏览挖掘结果
挖掘结束后,将在挖掘结果区中显示挖掘结果图标,右击该图标,选择“Browse”即可浏览挖掘结果。如图4-4、4-5所示。
图4-4 挖掘结果浏览窗口
图4-5 挖掘结果浏览窗口
在浏览窗口中,可树状浏览,也层次结构浏览,还可浏览有关挖掘过程的总结。
模型准确性评价
1)在结果输出区,双击得到的模型,模型将会在主工作区显示出来
2)右击用于测试的数据源,选择“Connect”命令,再单击1)步中在主工作区中显示的图标,这时会将测试数据连接到需要测试的模型上。
3)在挖掘工具区的“output”选项卡中,将“Analysis”节点拖放到主工作区,并将其连接到需要测试分析的节点上。
4)执行节点Analysis节点,得到如图4-6所示的界面。
图4-6 模型测试结果
医学决策支持系统
实 验 报 告
班 级
学 号
姓 名
实验名称
实验四 数据挖掘
指导老师
日 期
TIME \@ yyyy-M-d 2014-11-11
医药信息系医院信息系统教研室
您可能关注的文档
- 实验室安全事故案例.doc
- 实验室安全卫生值日表、值班日志.doc
- 实验室安全用电管理制度.doc
- 实验室安全之实验室人员出入管理制度.doc
- 实验室安全知识复习题.doc
- 实验室生物安全自查制度 2.doc
- 实验室体系文件宣贯考核试题.doc
- 实验室通风管道施工通病几大问题盘点(2).doc
- 实验室通风管道施工通病几大问题盘点(3).doc
- 实验室通宵实验审批表.doc
- 2025-2026学年科普版七年级下册英语Unit7 Being a Smart Shopper素养测评卷(含答案).docx
- 2025-2026学年科普版七年级下册英语Unit10 Lending a Helping Hand素养测评卷(含答案).docx
- 2025-2026学年科普版七年级下册英语Unit11 Rules Matter素养测评卷(含答案).docx
- 2025-2026学年科普版七年级下册英语Unit12 Better Together素养测评卷(含答案).docx
- 2026年中考英语语法选择专题训练(含答案).docx
- 2026中考语文二轮学思并重,涵养君子之德论语十二章、虽有佳肴、大道之行也.docx
- 中考文言文常见文化常识梳理.docx
- 中考语文二轮:内修君子德外尽忠臣心诚子书出师表修身立德主题学习.docx
- 中考语文二轮:不一样的求学路一样的成长梦送东阳马生序劝学主题学习.docx
- 中考语文二轮:《陋室铭》《爱莲说》托物寓意主题学习.docx
最近下载
- 中国神经外科重症患者气道管理专家共识(2025版).docx
- 《农产品区域公用品牌评价指南》.docx VIP
- 中央储备粮通辽直属库余粮堡分库新建储备仓施工项目施组设计.doc VIP
- 危险化学品安全知识培训.pptx VIP
- 中央储备粮唐山直属库油脂油料仓储物流项目三期工程施工组织设计最新.doc VIP
- 承包人自行施工范围内拟分包的非主体和非关键性工作.doc VIP
- 中央储备粮遂宁直属库有限公司搬迁项目滑模施工方案.docx VIP
- 危险化学品安全知识与处理培训.ppt VIP
- 方正证券-信息技术-OpenClaw赋能金融投研-17个高效应用案例详解——AI Agent赋能金融投研应用系列之三.pdf VIP
- 高二生物第一次月考卷【测试范围:苏教版2019选择性必修2第1章~第2章】(考试版).docx VIP
原创力文档

文档评论(0)