高等教育医学数据挖掘word版本.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高等教育医学数据挖掘;一、引言;一、引言;一、引言;一、引言;一、引言;二、聚类标准;二、聚类标准;二、聚类标准;三、k-means算法;三、k-means算法;三、k-means算法;三、k-means算法;三、k-means算法;三、k-means算法;三、k-means算法;三、k-means算法;三、k-means算法;三、k-means算法;三、k-means算法;四、EM算法;四、EM算法;四、EM算法;四、EM算法;四、EM算法;对某城市年龄范围为25岁~55岁的中青年人群进行调查。各属性的含义如下:;医学数学挖掘——SQL SERVER 2005 案例分析;Microsoft聚类分析通过其查看器来解释,SQL Server Analysis Server提供的聚类分析查看器有4个选项卡。聚类之间是相互联系的,通过单独的某一个视图难以理解挖掘模型,但可以同时使用这些视图。 聚类的目的之一是给每一类贴上标签;(1)获得顶层视图 ;(1)获得顶层视图;(2)选择一个聚类并且找出与其它聚类之间的区别,以聚类1为例:分类特征视图,该视图通过以递减概率显示属性来描述聚类事例的特征 ;点击分类对比选项卡,将分类1与它的补充进行了比较。 ;(3)确定一个聚类如何区别于相邻的聚类 这个聚类可能非常相似于其它的聚类,并且在这个时候所做的标识适用于所有这些聚类。 与聚类1相似的聚类强度都不大,相对来说,与类8和类10相似性大点。通过比较类1和8,可以看出这两个聚类的重要差异是劳动强度和是否早起;通过比较类1和10,可以看出这两个聚类的重要差异是是否养宠物。;(4)验证判断是否正确 通过比较聚类与其相邻的聚类,并且对聚类进行改进的时候,就有可能出现误导的情况: 两个聚类之间的差别可能是由一个属性引起的,该属性在这两个聚类中都不常见,但是在其中一个聚类中更少见。 通过对聚类1进行进一步验证,发现可以用“冠心病”标识“聚类1”,即聚类1的主要特征是有“冠心病”。;(5)对聚类进行标识 聚类1为“冠心病” ;结论: 冠心病高发人群有如下特点:高血脂,高血压,很少运动,经常熬夜,工作压力大,有家族新血压或心脏病病史,都不养宠物。同时发现男性比例显著高于女性的发病率等。 可以对这些因素进一步进行分析,对冠心病的预防、治疗及其医疗保健等有重要的指导作用。 ;作业;小结;?;此课件下载可自行编辑修改,仅供参考! 感谢您的支持,我们努力做得更好!谢谢

文档评论(0)

135****6041 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档