- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
并行算法之mapreduce
大数据+医疗 目录 关于大数据的各种书籍简介 云计算和物联网 大数据在医疗行业的运用:文字、图像、视频、物联网 非结构化大数据分析手段:聚类分析、机器学习 计算机大数据算法 大数据算法工具 关于大数据的各种书籍简介 关于亚马逊:贝佐斯创建的一个小书店发展成亚马逊,数据驱动型公司,建立了遍布全美的云存储器。优于淘宝之处在于控制产品质量,先行赔付,用户体验好。 关于谷歌:敏锐的聚焦网络搜索,搜索问题组成了非结构化数据库,以此为基础进行预测算法。Google Fit 关于苹果: HealthKit 关于大数据的各种书籍简介 《大数据营销:定位客户》商业营销中大数据的使用,例如在广告中找到人们最关注的部分,扩大这个部分;分析客户构成等;精准营销,定位到人。 《爆发》大数据对历史发展的预测。 《工业4.0》大数据驱动工业发展,开启产品全生命周期管理模式——物联网。 《大数据时代》作者抛出了大数据时代处理数据理念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果;万事万物数据化,数据交叉复用。 努力在可以应用、可以拓展的地方,应用它、拓展它;在不能应用、不能拓展的地方,就停下来。 《大数据云图》:对多个行业未来的展望,用计算机模拟来找到最优化解决方法。 云计算和物联网 云计算和物联网如今已是IT业界的两大焦点,它们有很大的区别,但同时也有着千丝万缕的联系——物联网通过数量惊人的传感器采集到难以计数的数据量,而云计算可以对这些海量数据进行智能处理。可以说,云计算是物联网发展的基石,而物联网又是云计算最大的用户,二者的融合可谓珠联璧合,相辅相成。在大数据时代,云计算融合物联网将进一步推动数据价值的挖掘,促进产业爆发。 云计算 云计算(cloud computing)是一种基于因特网的超级计算模式,在远程的数据中心里,成千上万台电脑和服务器连接成一片电脑云。因此,云计算甚至可以让你体验每秒10万亿次的运算能力,拥有这么强大的计算能力可以模拟核爆炸、预测气候变化和市场发展趋势。用户通过电脑、笔记本、手机等方式接入数据中心,按自己的需求进行运算。 IBM的创立者托马斯·沃森曾表示,全世界只需要5台电脑就足够了。比尔·盖茨则在一次演讲中称,个人用户的内存只需640K足矣。李开复打了一个很形象的比喻:钱庄。 大数据在医疗行业的运用 1、精细化医疗。 2、国家肿瘤中心开发的影像学和病理学自动识别软件,已超过医师平均水平。 3、各种砸钱不讨好的移动医疗,没有抓住痛点,没有找到经济增长点,无根之水。 有可能想象依赖于“分子症状,而不是临床症状来触发治疗干预更积极的医疗实践。——治疗未病 大数据时代的非结构化数据分析在医疗中的运用——前提 1、信息安全保障 2、病人唯一标识建立(MPI) 3、标准术语系统 (1、2对于结构化数据依然需要) 大数据时代的非结构化数据处理在医疗中的运用——文字分析 1、语言处理技术: 建立标准术语系统→医学知识模型→信息提取→文本模块化 2、数据挖掘技术: 机器学习 统计学习 规则归纳 3、应用:电子病历数据挖掘支持临床决策、建立临床路径、临床指南,诊疗过程追踪 大数据时代的非结构化数据处理在医疗中的运用——图像 生物特征识别技术通常按照,扫描、数字化处理、分析、特征提取、存储、匹配分类几个步骤处理。目前扫描数字化处理已经相对成熟,主要的研究集中在分析和特征提取方面。 计算机辅助诊断技术:医学CAD 1、图像预处理:灰度直方图、去噪、图像增强 2、图像特征提取:边缘分割、灰度共生矩阵 3、图像分类:支持向量机算法(神经网络的一种衍生算法) 大数据时代的非结构化数据处理在医疗中的运用——图像之全息眼镜 大数据时代的非结构化数据处理在医疗中的运用——视频 远程医疗 在线教育:人卫开放大学等 大数据时代的非结构化数据处理在医疗中的运用——物联网 安大略理工大学的卡罗琳?麦格雷戈(Carolyn McGregor)博士和一支研究队伍与IBM一起和很多医院合作,用一个软件来监测处理即时的病人信息,然后把它用于早产儿的病情诊断。系统会监控16个不同地方的数据,比如心率、呼吸、体温、血压和血氧含量,这些数据可以达到每秒钟1260个数据点之多。在明显感染症状出现的24小时之前,系统就能监测到早产儿细微的身体变化发出的感染信号。 穿戴设备 生命体征监测床 如何用软件来实现这些大数据分析工作呢?以下讲一种机器学习的方法。 大数据分析手段 ——机器学习 机器学习:机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。 机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。 机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进
文档评论(0)