实验四 Clementine数据挖掘.docVIP

  • 255
  • 0
  • 约3.06千字
  • 约 7页
  • 2020-10-06 发布于浙江
  • 举报
实验四 数据挖掘实验指导 目的 掌握数据挖掘工具Clementine的基本方法与操作。 任务 利用Clementine对药物数据进行简单的数据挖掘操作,熟悉数据挖掘的基本步骤。 要求 了解数据挖掘的基本步骤,完成针对给定数据的决策树挖掘/关联规则分析/聚类分析,并写出实验报告。 实验内容 利用Clementine对Drug.txt中药物研究数据进行决策树、关联规则分析,观察挖掘的结果,比较这些方法挖掘结果的异同,根据观察的结果写出实验报告。 注:药物研究数据来源于对治疗同一疾病病人的处方,这些病人服用不同药物,取得了相同效果。其中所含数据项如下: Age: 年龄 Sex: 性别(M\F) Drug: 病人所服药物种类(A/B/C/X/Y) BP: 血压(High\Normal\Low) Cholesterol: 胆固醇(Normal\High) Na: 唾液中钠元素含量 K: 唾液中钾元素含量 希望通过数据挖掘发现这些处方中隐藏的规律,给出不同临床特征病人更适合服务哪种药物的建议,为未来医生填写处方提供参考。 实验环境 硬件:P4/256MB台式计算机 软件:Windows 2000 Professional/SQL Server 2000/Clementine 8.1及以上 数据:Drugs数据 (文件Drug.txt) 步骤 启动clementine 双击桌面数据挖掘工具“clementine 8.1” 图标或C:\Clementine 8.1\bin\Clementine.exe,即可启动该挖掘工具,界面如图4-1所示。 主工作区结果输出区 主工作区 结果输出区 挖掘工具区 图4-1 clementine操作界面 数据挖掘操作 挖掘流(stream)操作 新建:File菜单?New Stream命令 保存/另存:File菜单?Save Stream /Save Stream As…命令?指定保存位置、文件名称?保存按钮 打开:File菜单?Open Stream…命令?指定要打开流的位置、文件名称?打开按钮 挖掘步骤 (1)建立连接数据源 1)在挖掘工具区选项卡“Sources”中将“Var. File”节点拖入到主工作区。 2)右击该节点,选择“Edit”命令,并选择“File”选项卡,显示如图4-2所示界面 图4-2 数据源编辑器 3)指定数据来源的文件名,设定源数据存放格式(如是否从文件中读取字段名、数据分隔符号、…) 4)如需要对数据进行过滤则可在图4-2界面中选择“Filter”选卡;如需要对数据类型进行转换则可在图4-2界面中选择“Types”选卡。 设置完后,单击“OK”/“Apply”按钮,完成数据源连接。 (2)指定挖掘模型 在挖掘工具区中选择“Modeling”选卡,将合适的挖掘模型拖到主工作区(如C5.0)。 (3)将数据源与挖掘模型连接起来 右击主工作区中所建立的数据源,选择“Connect…”命令,再单击要与该数据源连接的挖掘模型。 (4)设置挖掘模型 右击主工作区中的挖掘模型,选择“Edit”命令,如图4-3所示。 图4-3 挖掘模型设置 选择“Fields”选项卡,选择“Use custom settings”,并通过下拉菜单,选择“Target”和“Inputs”数据列,单击“OK”关闭对话框。选择“Model”选卡可设置模型名称、输出类型等,选择“Costs”选卡则可设置训练的代价。 (4)执行挖掘 执行挖掘流中的所有挖掘模型,可单击窗口上侧工具栏中按钮“Execute the current stream”;只执行指定挖掘模型,则先单击相应模型,再单击窗口上侧工具栏按钮“Execute selection”。 浏览挖掘结果 挖掘结束后,将在挖掘结果区中显示挖掘结果图标,右击该图标,选择“Browse”即可浏览挖掘结果。如图4-4、4-5所示。 图4-4 挖掘结果浏览窗口 图4-5 挖掘结果浏览窗口 在浏览窗口中,可树状浏览,也层次结构浏览,还可浏览有关挖掘过程的总结。 模型准确性评价 1)在结果输出区,双击得到的模型,模型将会在主工作区显示出来 2)右击用于测试的数据源,选择“Connect”命令,再单击1)步中在主工作区中显示的图标,这时会将测试数据连接到需要测试的模型上。 3)在挖掘工具区的“output”选项卡中,将“Analysis”节点拖放到主工作区,并将其连接到需要测试分析的节点上。 4)执行节点Analysis节点,得到如图4-6所示的界面。 图4-6 模型测试结果 医学决策支持系统 实 验 报 告 班 级 学 号 姓 名 实验名称 实验四 数据挖掘 指导老师 日  期 TIME \@ yyyy-M-d 2014-11-11 医药信息系医院信息系统教研室

文档评论(0)

1亿VIP精品文档

相关文档