网站大量收购闲置独家精品文档,联系QQ:2885784924

数据科学技术与应用——基于Python实现(第2版)课件 1-数据科学基础.pdf

数据科学技术与应用——基于Python实现(第2版)课件 1-数据科学基础.pdf

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据科学基础

计算机科学与技术学院

数据的力量

•数据:改变世界的力量

•世界被数据化

•洞察数据背后的规律,帮助我们正确决策

•数据结果反作用于人们的行为

•数据正在成为组织最重要的资产,数据分析解读的能

力成为组织的核心竞争力

•实例:

•政府

•企业

•日常工作

实例1

•杭州公交借助共享单车轨迹改善公交线路

•背景问题

•杭州公交集团的286B路线路,某两站每天聚集着数百上千

辆共享单车

•解决方案

•分析共享单车出行轨迹数据,发现单车主要社区来源

•优化286B公交车的线路、首末班时间、发车频率

•效果

•将乘客直接送到了家门口

•新线路缓解了区域出行压力,疏导了共享单车密集可能带

来的道路隐患

实例3

•图像数据分析辅助放射科医生读片,提高医疗效率

•背景

•医疗诊断过程中CT、X片等应用日益广泛

•我国医学影像数据的年增长率约为30%,而放射科医师数量的年增长率为4.1%

•解决方案

•基于医院历史的影像资料,利用机器学习等方法建立识别模型,自动读片进

行疾病的检测

•需要几万至几十万正确标注后的影像资料进行训练

•达到甚至超过人工检测的准确率

•皮肤癌、直肠癌、肺癌识别、糖尿病视网膜病变、前列腺癌、骨龄检测

•为医生提供了高效的诊断辅助工具

•机器读片比较容易继承经验知识,客观、快速地进行定性和定量分析

数据科学(DataScience)

•数据科学研究的就是从数据形成知识的过程

•通过假定设想、分析建模等处理方法,从数据中发现

可使用的知识、改进关键决策过程

•数据科学的最终产物是数据

产品

•表现为一种发现、预测、服务、

推荐、决策、工具或者系统。

数据、信息和知识

•数据科学的目标:从数据中发现知识

•数据是世界的特征表现

•零散的符号,数字、文字、声音、图像等

•经过组织和处理后,数据被抽象为信息

•有价值的数据称为信息

•知识是对某一个主题的理论或实际的理解

知识

信息

数据

室外很冷,

室外温度为

室外很冷那么要穿一

2°C

件厚衣服

数据科学的知识结构

•新兴跨领域综合性学科

•继承了各领域数十年甚至数百年的工作成果,包括统计

学、计算机科学、数学、工程学以及其他学科

•领域专长

•从事数据工作的人员需要了解数据来源的业务领域,

您可能关注的文档

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档