(实验报告)基于SPSS-Modeler的药物研究数据挖掘与建模评估.pdf

(实验报告)基于SPSS-Modeler的药物研究数据挖掘与建模评估.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实 验 报 告 小组成员 姓名 学号 一、实验名称: 基于 SPSS Modeler 的药物研究数据挖掘与建模评估 二、实验目的: 1、在所选案例的具体分析中,通过数据挖掘考察影响病人治疗的各个变量 的数据分布特征,并对病人的药物选择的考虑因素建立决策树模型并进行预测 精度评价。 2、通过本案例的实验操作,理解和掌握基于 SPSS Modeler 的数据挖掘辅助 决策过程。 三、实验数据: 本实验研究的案例数据是SPSS Modeler 软件自带的一组药物研究的数据(详 见 GRUG.txt ),描述如下:根据统计,许多患有同种疾病的不同病人,服用5 种 药物中的一种(Drug,分为 drugA、drugB、drugC、drugX、drugY )之后都取得 了同样的治疗效果;随机挑选部分病人服用药物前的基本临床数据,包括:血 压(BP,分为高血压 HIGH、正常 NORMAL、低血压 LOW)、胆固醇(Cholesterol , 分为正常 NORMAL 和高胆固醇 HIGH)、唾液中钠元素(Na)和钾元素(K)含量、 病人年龄(Age )、性别(Sex ,包括男 M 和女 F)等。 四、实验方法: 1 / 11 运用 SPSS Modeler 软件(本实验使用版本为 18.0)进行数据挖掘发现以往 药物处方适用的规律,给出不同临床特征的病人更适合服用哪种药物的建议, 为医生开具处方提供参考;同时,建立药物选择的决策树模型,并对所建的模 型进行预测精度的分析评价。 五、实验步骤: 1、将数据读入到 Modeler 中。 在【源】选项卡中选择【变量文件】节点,并设置节点参数。在【文件】 选项中制定从文件 DRUG.txt 中读入数据。如下图: 2、浏览数据内容。在【输出】选项卡中选择【表格】节点,添加到数据流 中,运行该节点生成数据表。如下图: 2 / 11 3、观察各变量的数据分布特征。在【输出】选项卡中选择【表格】节点, 添加到数据流中,运行该节点生成数据表。如下图: 图形显示:该组数据共有 200 个样本,Age 、Na、K 为数值型变量。软件的 3 / 11 【数据审核】功能自动计算出了最小值、最大值、均值、标准差、偏度等基本 描述统计量;数据显示,病人的年龄最大值和最小值的差距比较大。同时,软 件的【数据审核】功能还输出了数值型变量的直方图和分类型变量的柱形图; 图形表明,病人的Age 、BP、Cholesterol 水平的分布比较均匀,总体差异不大, 但服用药物 drugY 的病人明显多于服用其他药物的人数。 4 、观察服用不同药物的病人唾液中钠元素和钾元素的含量。 以散点图为例:在【图形】选项卡中选择【散点图】节点,添加到数据流 中,并设置节点参数,指定 Na 为 x 轴、K 为 y 轴,服用不同药物的病人数据表 示为不同颜色的点。运行节点生成图形文件,如下图:

文档评论(0)

祝星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档