数据挖掘研究设计周四晚10-12节.pptxVIP

  • 3
  • 0
  • 约1.19万字
  • 约 150页
  • 2022-10-28 发布于北京
  • 举报
数据挖掘研究设计及分析方法浙 江 省 中 医 院信息部 临床评价分析中心张 颖2017.10.31研究时有无设计干预因素?有无实验性研究观察性研究有无对照组有无是否随机分析性研究描述性研究否是时间方向暴露→结局结局→暴露病例对照研究队列研究横断面研究随机对照试验非随机对照试验观察性研究 由于医学研究对象的特殊性,在很多科研中,研究者不能主动地控制研究因素。这种在自然状态下,观察疾病发生、发展、诊治过程中表现出来的特点和规律,以阐述疾病的分布特征,认识病因和影响因素,分析防治过程中相关规律和特征的研究方法,称为观察性研究。 本期内容第一部分数据挖掘研究概述第二部分医疗海量数据来源第三部分 数据挖掘操作步骤第四部分SPSS Clementine软件应用 一、数据挖掘研究概述1、数据挖掘的概念2、数据挖掘的特点3、数据挖掘的需求数据挖掘的概念数据挖掘——从大量数据中提取潜在有用的信息和知识的过程,是统计学、数据库技术和人工智能技术的综合。数据挖掘——随着现代计算机及各种信息分析技术的发展而迅速兴起,现已被广泛应用于包括医药学在内的多个领域。数据挖掘——利用已有的数据,数据收集过程不经过特意的科研设计,目的是发现规律,而不是验证假设。收集再分析分析客观世界数据信息知识指导图:数据、信息与知识一、数据挖掘研究概述1、数据挖掘的概念2、数据挖掘的特点3、数据挖掘的需求数据挖掘的特点1基于数据分析方法角度的分类本质上属于观察性研究2数据来源于日常诊疗工作资料3应用的技术较传统研究更先进4分析工具、理论模型与传统研究区别较大5一、数据挖掘研究概述1、数据挖掘的概念2、数据挖掘的特点3、数据挖掘的需求大数据时代移动互联网、社交网络、电子商务、金融、医疗、物流、商业……微博facebook社交网络淘宝、ebay…电子商务…手机、Apps移动互联大数据是什么?大数据=海量数据+分析软件+挖掘过程软件是大数据的驱动力、引擎,软件改变世界 哪些行业适合应用大数据?契合度优先关注行业用户应用特点与大数据技术有较高的契合度,在主客观条件上也有较高的应用可能性。值得关注行业用户应有特点与大数据的契合度及应用可能性综合较高政府(公共事业)互联网(电子商务)医疗High电信制造纵轴契合度: 表示该用户的IT应用特点与大数据特性的契合程度;横轴应用可能性:表示该用户出于主客观因素在短期内投资大数据的可能性;注: 该位置为分析师访谈的综合印象,为定性分析,图中位置不代表具体数值金融能源(电力/石油)适当关注行业用户两个维度暂时都不具备优势,可适当给予关注教育Mid流通零售交通Low应用可能性HighLowMid数据挖掘的医疗需求医疗是复杂的大数据运营体!业务人员和管理人员每日都面临信息重负!常见病种:8000多种……常见术种:5000多种……常用药品:8000余种类……医用材料:近10万条目……实验室数据:几十万条……新业务技术:不断更新…时间数据:接诊、会诊、开台、给药、抢救……进入大数据时代更需要以数据和信息为主体的循证决策支持。本期内容第一部分数据挖掘研究概述第二部分医疗海量数据来源第三部分 数据挖掘操作步骤第四部分SPSS Clementine软件应用 二、医疗海量数据来源医院电子病历信息系统:病案首页、HIS、LIS、电子病历系统、PACS区域医疗专项系统:军队系统——中国重大疾病临床诊疗数据库中医系统——医疗科研信息一体化系统针对病种的专项系统:MIMIC Ⅲ本期内容第一部分数据挖掘研究概述第二部分医疗海量数据来源第三部分 数据挖掘操作步骤第四部分SPSS Clementine软件应用 数据挖掘研究的基本步骤知识第三步骤挖掘解释/评估分析数据数据挖掘算法解释数据第一步骤选择第四步骤解释预处理及变换准备数据变换后的数据清理筛选第二步骤处理目标数据三、数据挖掘操作步骤1.选择数据2.处理数据3.挖掘分析4.结果解释第一步:选择数据收集获取原始数据 根据研究目的,进行需要被挖掘分析的原始数据采集。评估数据的可获得性。可以采用较小规模的数据对问题的可行性进行初步研究。原始数据可能会分布于不同的信息系统中,需要对信息系统充分理解,并有相应的技术实现数据的导出。原始数据的采集非常费时费力,在研究工作中占较大的比重(通常占全部工作的20%) 。三、数据挖掘操作步骤1.选择数据2.处理数据3.挖掘分析4.结果解释第二步:处理数据数据预处理(工作量大,通常占全部工作的40%)—— 把数据转换成可供数据挖掘的格式及内容主要包括: (1)将字符型变量转换为数值型变量(例,将年龄“六十岁?60”;性别“男/女?1/2”);(2)将连续性变量转换为分类变量(例,BMI ?BMI分级);(3)通过函数计算获取新变量并根据实际意义进行分类(例,通过身高和体重计算BMI );(4)其

文档评论(0)

1亿VIP精品文档

相关文档