- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实 验 报 告
小组成员
姓名
学号
一、实验名称:
基于 SPSS Modeler 的药物研究数据挖掘与建模评估
二、实验目的:
1、在所选案例的具体分析中,通过数据挖掘考察影响病人治疗的各个变量
的数据分布特征,并对病人的药物选择的考虑因素建立决策树模型并进行预测
精度评价。
2、通过本案例的实验操作,理解和掌握基于 SPSS Modeler 的数据挖掘辅助
决策过程。
三、实验数据:
本实验研究的案例数据是SPSS Modeler 软件自带的一组药物研究的数据(详
见 GRUG.txt ),描述如下:根据统计,许多患有同种疾病的不同病人,服用5 种
药物中的一种(Drug,分为 drugA、drugB、drugC、drugX、drugY )之后都取得
了同样的治疗效果;随机挑选部分病人服用药物前的基本临床数据,包括:血
压(BP,分为高血压 HIGH、正常 NORMAL、低血压 LOW)、胆固醇(Cholesterol ,
分为正常 NORMAL 和高胆固醇 HIGH)、唾液中钠元素(Na)和钾元素(K)含量、
病人年龄(Age )、性别(Sex ,包括男 M 和女 F)等。
四、实验方法:
1 / 11
运用 SPSS Modeler 软件(本实验使用版本为 18.0)进行数据挖掘发现以往
药物处方适用的规律,给出不同临床特征的病人更适合服用哪种药物的建议,
为医生开具处方提供参考;同时,建立药物选择的决策树模型,并对所建的模
型进行预测精度的分析评价。
五、实验步骤:
1、将数据读入到 Modeler 中。
在【源】选项卡中选择【变量文件】节点,并设置节点参数。在【文件】
选项中制定从文件 DRUG.txt 中读入数据。如下图:
2、浏览数据内容。在【输出】选项卡中选择【表格】节点,添加到数据流
中,运行该节点生成数据表。如下图:
2 / 11
3、观察各变量的数据分布特征。在【输出】选项卡中选择【表格】节点,
添加到数据流中,运行该节点生成数据表。如下图:
图形显示:该组数据共有 200 个样本,Age 、Na、K 为数值型变量。软件的
3 / 11
【数据审核】功能自动计算出了最小值、最大值、均值、标准差、偏度等基本
描述统计量;数据显示,病人的年龄最大值和最小值的差距比较大。同时,软
件的【数据审核】功能还输出了数值型变量的直方图和分类型变量的柱形图;
图形表明,病人的Age 、BP、Cholesterol 水平的分布比较均匀,总体差异不大,
但服用药物 drugY 的病人明显多于服用其他药物的人数。
4 、观察服用不同药物的病人唾液中钠元素和钾元素的含量。
以散点图为例:在【图形】选项卡中选择【散点图】节点,添加到数据流
中,并设置节点参数,指定 Na 为 x 轴、K 为 y 轴,服用不同药物的病人数据表
示为不同颜色的点。运行节点生成图形文件,如下图:
文档评论(0)