基于数据挖掘技术的医患关系数据分析.docx

基于数据挖掘技术的医患关系数据分析.docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

基于数据挖掘技术的医患关系数据分析

?

?

张浩

摘要:虽然医疗技术和医疗水平在不断提高,但患者对医疗效果及期望越来越高,医务人员始终无法使患者的医疗需求得到有效满足,致使当前医患关系越发紧张。本文利用数据挖掘工具Weka,根据已有医患关系数据集,分析兰州市各级医院不同职称、学历、工龄的医务人员在职业过程中产生的精神压力及对家庭造成的影响。研究发现,医患关系与社会和患者对医务人员的尊重程度、患者对医疗服务的信任度和满意度有密切的联系。分析数据挖掘结果,为医务人员改善医患关系提供方向和对策,为政府部门维护医疗市场和保障医务人员的健康提供卫生学理论依据和具体应对措施。

关键词:医患关系;数据挖掘;Weka

:R197.323:A:1007-9416(2019)08-0192-02

0引言

本文旨在研究当前医患关系和兰州市现阶段各级医院不同职称、学历、工龄的医务人员在职业过程中产生的精神压力及对家庭造成的影响。通过数据挖掘工具Weka分析数据挖掘结果,为医务人员改善医患关系提供方向和对策,为政府部门维护医疗市场和保障医务人员的健康提供卫生学理论依据和具体应对措施。

1数据挖掘工具Weka

Weka是Waikato大学开发的全面的数据挖掘系统,它用Java语言实现并提供了适用于任何数据集的数据预处理和算法性能评价的方法,用户可根据需求加入个性化算法,并封装到系统内。它還提供了Java函数和类库,用户可以在数据挖掘的实际实验过程中随意调用。

2数据来源

本研究以兰州市医疗数据为数据集,对兰州市现阶段不同级别的医院,不同职称、学历、工龄的医务人员数据进行挖掘,所研究的医患关系数据集来源于已有的问卷调查。该调查覆盖了兰州市辖区内5家省级医院、5家市级医院和8县区县级医院,包含了1280名医务人员、医院周边1280名非医疗机构工作人员以及兰州市所调查医疗机构辖区内的1280名患者。人员比例按照概率比例规模抽样法(PPS),按省级医院32人、市级医院60人、县级医院100人的比例随机抽取调查对象。总共发放关于医务人员、患者和普通群众的调查问卷分别1280份,分别回收1100、923和988份有效问卷,本文只对医务人员数据表进行分析。

问卷调查得到的数据以.xls文件格式存储在Excel中,数据整体上比较完整,属性值较齐全,准确度和可信度较高,适合用来做数据挖掘分析。

3数据预处理

3.1数据清理

(1)去掉冗余的字段。将年龄、工作年数、所在科室等属性保留下来,其余姓名、地区的等字段去掉。(2)缺失值的处理。本文采用属性的均值填充缺失值,对整个数据集的影响不大。

3.2数据集成和变换

对于医务人员,问卷共设有153个问题,问题的选项个数在2到8之间,为了挖掘的顺利进行,统一对各属性及属性值进行处理。对医务人员的8个调查表依次进行编号{A,B,C,...,H},表中的每个属性按顺序统一编号{1,2,...},每个属性的编号即{A1,A2,A3,...};对于每个属性值按照问题选项的顺序依次编号,即{1,2,...,8}。

3.3数据归约和离散化

经过数据预处理之后,数据格式、数据值基本上都一致,由于数据是数值属性,需要将其转换为标称类别。最终数据集如表1所示。

4基于Weka工具的医患关系数据分析

4.1数据集

数据集表中各字段含义:患者对医务人员的尊重程度,a非常尊重、b比较尊重、c一般、d比较不尊重、e非常不尊重。

4.2计算分类属性的期望信息量

将数据分为五类,a类共71个,b类共330个,c类共537个,d类共108个,e类共54个,总计1100个。由公式计算出的期望信息量为1.824。

4.3分析步骤

(1)将医患关系数据集导入Weka平台。(2)查看数据集的五个属性值分布情况,发现数据属性值分布较明显,因此选取C4.5算法对五个属性值进行分析。(3)选择J48(Weka中的C4.5算法),得到如图1所示的分析结果。

从图1中看出决策树的准确率是65.2727%,得到的决策树如图2所示。

4.4分析规则的提取和结果分析

从如图2所示的决策树模型中提取分类规则。

其中提取分类结果是“a”的规则为:

IF“H97”=“a”,THEN分类结果是“a”;IF“H97”=“e”AND“H99”=“a”,THEN分类结果是“a”;IF“H97”=“e”AND“H99”=“b”,THEN分类结果是“a”;

其中提取分类结果是“b”的规则为:

IF“H97”=“b”,THEN分类结果是“b”;IF“H97”=“b”AND“H99”=“b”AND“H102”=“c”,THEN分类结果是“b”;

其中提取分类结果是“c”的规则为:

IF“H97”=“c”,THEN分类结果是“c”;IF“H97”=“d”AND“

文档评论(0)

136****6482 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档