- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘与医学数据资源开发利用.ppt.ppt
一、引言 什么激发了数据挖掘 近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛应用于各种领域,如商务管理、生产控制、市场分析、工程设计和科学探索等。 一、引言 面对海量数据库和大量繁杂信息,如何才能从中提取有价值的知识,进一步提高信息的利用率,由此引发一个新的研究方向:基于数据库的知识发现(Knowledge Discovery in Database)及相应的数据挖掘(Data Mining)理论和技术的研究。 二、目前医学数据资料的状况 我国医疗行业计算机的发展: 70年代,计算机进入医院,主要是国外医院应用,以小型机为主,采用单机用户阶段; 80年代,医院信息系统进入大型医院,开始建立小型的局域网; 90年代,计算机技术及网络通讯等信息技术的发展,医院的信息系统开始发展起来。 二、目前医学数据资料的状况 什么是医学数据? 医学领域的数据是一个很复杂的数据库; 医学数据是从医学影像、实验数据以及医生和病人的交流中获得的,所以原始的医学数据具有多种形式。 二、目前医学数据资料的状况 医学数据: 影像(SPECT,B超,CT等) 信号(肌电信号、脑电信号等) 纯数据(体征参数、化验结果) 文字(病人的身份记录、症状描述、检测和诊断结果) 二、目前医学数据资料的状况 电子医学数据: 电子病历 医学影像 病理参数 化验结果 二、目前医学数据资料的状况 电子信息库: HIS系统 EMR系统 LIS系统 …………………… 三、医学数据在数据挖掘中的应用 数据挖掘(Data Mining): 就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 什么是数据挖掘? 通过采用自动或半自动的手段,在海量数据中发现有意义的行为和规则的探测和分析活动。 数据挖掘是从数据中自动地抽取模式、关联、变化、异常和有意义的结构 三、医学数据在数据挖掘中的应用 医疗数据的特点: 多态性 不完整性 实践性 冗余性 隐私性 数据挖掘流程 确定目标 对现有资源评估,确定问题是否能够通过数据挖掘来解决,确定数据挖掘的目标,制定数据挖掘计划 数据理解 确定数据挖掘所需要的数据,对数据进行描述,数据的初步探索,检查数据的质量 数据准备 选择数据,清理数据,对数据进行重建,调整数据格式使之适合建模 可扩展性的体系结构 三、医学数据在数据挖掘中的应用 数据挖掘在医疗领域的主要应用: 数据挖掘在医院管理部门的应用 数据挖掘在基础医学领域的应用 在疾病的临床诊断和治疗方面的应用 在流行病方面的预测 在药物研究开发中的应用 三、医学数据在数据挖掘中的应用 数据挖掘在医院管理部门的应用: 医院信息系统(HIS系统):管理医院内部财务、物流、处理患者问题 急门诊人次 科室的就诊人次 住院病人人次 三、医学数据在数据挖掘中的应用 在基础医学领域的应用: DNA序列分类排序以及对基因组测序数据的分析; 肿瘤分类基因的记忆; 致病基因的发现和遗传数据的分析研究。 三、医学数据在数据挖掘中的应用 在疾病的临床诊断和治疗方面的应用: 通过数据挖掘对大量的病人病历以及治疗手段进行预测、清洗,分类以及归档; 挖掘出有价值的诊断规则,为临床决策服务; 把专家的经验转化为关联规则,根据患者的症状作出判断。 三、医学数据在数据挖掘中的应用 在流行病方面的预测: 结合医学统计,对流行病防治以及危险因素的筛选 对大量的健康体检资料进行整理 三、医学数据在数据挖掘中的应用 药物研究开发中的应用: 新药计算机辅助药物设计系统的利用,缩短了先导化合物发现周期,降低了新药的开发成本。 对于中医药的开发,KDD技术可以探讨并形成新的中药组方配伍理论,指导中药复方新药开发研究。 四、数据挖掘的主要方法 数据挖掘的三部曲: 数据准备 数据挖掘 结果评估 数据挖掘系统的分类 一般功能 描述性的数据挖掘 预测性的数据挖掘 不同的视角,不同的分类 根据所挖掘的数据库类型分类 根据挖掘的知识类型分类 根据挖掘所用的技术分类 根据数据挖掘的应用分类 四、数据挖掘的主要方法 医学数据挖掘的主要方法: 聚类分析 关联分析 决策树 四、数据挖掘的主要方法 什么是聚类分析? 定义:将一些对象的集合分成由类似的对象组成的多个类的过程称为聚类。 由聚类生成的簇(类):一组对象的集合。 同一簇(类)中的对象彼此相似,与其他簇(类)中的对象相异 提取客户的特征值。 四、数据挖掘的主
您可能关注的文档
- 操作风险管理简介.pdf
- 攀枝花人行天桥施工组织设计.doc
- 支付宝介绍.ppt
- 支付宝行业解决方案.ppt
- 支付宝,移动支付介绍.pdf
- 支付改变生活-阿里巴巴集团支付宝推介.ppt
- 支架精细显影StentBoost在日常DES中的应用_刘健.ppt
- 支架进展修回-沈策.doc
- 支架金属材料.ppt
- 收藏夹改版用户体验研究报告.pdf
- 学好普通话推广普通话主题教育中小学生主题班会教育PPT课件.pptx
- 学习雷锋-015中小学生主题班会教育PPT课件.pptx
- 小学二年级开学第一课期中期末家长会PPT课件模板04.pptx
- 学习雷锋-001中小学生主题班会教育PPT课件.pptx
- 四年级开学第一课期中期末家长会PPT课件模板11.pptx
- 学习雷锋-019中小学生主题班会教育PPT课件.pptx
- 卡通风预防网络沉迷主题教育中小学生主题班会教育课件.pptx
- 小学开学第一课期中期末家长会PPT课件模板小学家长会PPT-11.pptx
- 如何做好时间管理珍惜时间勤奋学习主题班会.pptx
- 四年级开学第一课期中期末家长会PPT课件模板13.pptx
文档评论(0)