深度学习:深度挖掘数据新经济.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

深度学习:深度挖掘数据新经济

作者:暂无

来源:《新经济导刊》2018年第1期

文/姜疆

由于传统的机器学习算法大多是基于内存的,而TB甚至PB级的海量数据又无法装载进

计算机内存,因此,现有的诸多算法不能处理大数据。如何使机器学习算法适应大数据挖掘的

要求,已经成为产业界与学术界研究的主要方向。目前,采用深度学习对数据进行挖掘是比较

热门的方法,因为其不仅能自动对数据进行快速处理,而且准确度较高。

事件“深度学习”应用到医学诊断

2017年,AI医疗领域备受资本市场关注,尤其是到2017年下半年,推想科技、图玛深

维、汇医慧影等企业都相继完成了B轮融资。国内高端医疗影像设备生产商联影今年也注资3

亿元人民币成立人工智能子公司进军医疗人工智能领域。此外,还有腾讯的“觅影”,阿里健

康的“DoctorYou”等都在医学影像的智能辅助诊断系统上有所布局。

医学诊断是机器深度学习技术应用对接的重要领域之一。2017年,Nature报道了谷歌运

用深度学习技术(主要是卷积神经网络)在该领域取得的新突破。谷歌通过分析眼球的视网膜

图像,可以预测一个人的血压、年龄和吸烟状况,而且初步研究表明,这项技术在防范心脏病

发作上很有成效。深度学习技术正改变着生物医疗学家处理分析图像的方式,甚至有助于发现

从未触及的现象,有望开辟一条新的研究道路。

此外,随着数据库技术的发展和中医领域数据的暴涨,数据挖掘方法甚至开始引入到中医

药研究上,产生了中医数据挖掘。不同于传统科学数据,中医药数据有自己的特点,中医药数

据的特点主要包括:症状的模糊性、证候的多态性、证候与症状间的非线性、中医药数据的多

维性以及挖掘的复杂性。基于此类特点,传统简单的统计分析工具已经不能满足中医现代化、

信息化发展的根本需求。而中医数据挖掘技术正适合于复杂多维的数据分析,运用相应的算法

可以从海量的中医药数据中发现知识。

尤为值得重视的是,近年来,我国一些院校为进一步促进中医领域的信息化、智能化发展,

数据挖掘在中医药相关研究上越来越深入。比如江西中医药大学计算机学院的一项研究着重对

目前中医数据挖掘的研究方向进行了具体分析,除了改进传统挖掘算法的趋势、扩展经典算法

在中医药数据领域应用的趋势之外,还引进了新的挖掘算法和技术。

华东理工大学学者以慢性胃炎患者中医问诊数据为研究样本,从挖掘样本特征之间关系和

挖掘类别标签之间关系两个角度出发,采用二类相关和深度置信网络,或深度玻尔兹曼机模型

的基于深度学习的多标记学习法,分别建立深度学习和条件随机场模型,对中医慢性胃炎患者

问诊数据进行训练和预测,得到五个常见指标下的实验结果符合中医理论,明显优于其他常见

方法。

背景数据挖掘与机器学习相互促进

从海量的数据库中挖掘信息的过程就称之为数据挖掘。换句话说,在数据库中的海量数据

里找出隐含的、之前未知的有研究价值的信息的这一非平凡过程就是所谓数据挖掘。

数据挖掘是一项探测大量数据的业务流程,而且是以发现有意义的模式(pattern)和规

则(rule)为目的的。数据挖掘是基于机器学习、人工智能、模式识别等的一种决策支持过程,

来智能分析企业数据,做出归纳性预测,帮助决策者根据已挖掘出的潜在的模式决策出正确的

方案。

数据挖掘是要构造一个分类函数或模型(常称作分类器),该函数是根据事物属性、特点

加以划分,而且该函数或模型能把数据库中的数据项映射到一个指定的分类类别,即分类功能;

把整个数据库划分成不同的群组,并且规定同一群组内数据尽量接近相同、不同的组群差别显

著,此为数据的聚类;关联分析就是采用关联规则和序列模式技术发现数据库各值的相关性;

数据的预测顾名思义,把握数据规律,做出合理推测;偏差的检测是对少数的极端数据进行分

析,表明其内在原因。

由于数据挖掘是一个复杂的迭代过程。通过在数据集上不断地循环处理,最终得到有意义

的知识或模式。这就要求我们充分利用计算机计算和存储上的优势。数据挖掘算法中常用的有

统计型算法和机器学习型算法两类。前者常用相关性分析、聚类分析、概率和判别分析等进行

运算;后者的特色是运用了人工智能技术,能在大量样本集训练和学习后自动找出运算需要的

参数和模式。

机器学习这门学科所关注的问题是:计算机程序如何随着经验积累自动提高性能。这是卡

内基梅隆大学教授、美国《MachineLeaming》杂志、国际机器学习年度

文档评论(0)

肖陆乱撞 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档