- 1、本文档共44页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
数据科学基础
计算机科学与技术学院
数据的力量
•数据:改变世界的力量
•世界被数据化
•洞察数据背后的规律,帮助我们正确决策
•数据结果反作用于人们的行为
•数据正在成为组织最重要的资产,数据分析解读的能
力成为组织的核心竞争力
•实例:
•政府
•企业
•日常工作
实例1
•杭州公交借助共享单车轨迹改善公交线路
•背景问题
•杭州公交集团的286B路线路,某两站每天聚集着数百上千
辆共享单车
•解决方案
•分析共享单车出行轨迹数据,发现单车主要社区来源
•优化286B公交车的线路、首末班时间、发车频率
•效果
•将乘客直接送到了家门口
•新线路缓解了区域出行压力,疏导了共享单车密集可能带
来的道路隐患
实例3
•图像数据分析辅助放射科医生读片,提高医疗效率
•背景
•医疗诊断过程中CT、X片等应用日益广泛
•我国医学影像数据的年增长率约为30%,而放射科医师数量的年增长率为4.1%
•解决方案
•基于医院历史的影像资料,利用机器学习等方法建立识别模型,自动读片进
行疾病的检测
•需要几万至几十万正确标注后的影像资料进行训练
•达到甚至超过人工检测的准确率
•皮肤癌、直肠癌、肺癌识别、糖尿病视网膜病变、前列腺癌、骨龄检测
•为医生提供了高效的诊断辅助工具
•机器读片比较容易继承经验知识,客观、快速地进行定性和定量分析
数据科学(DataScience)
•数据科学研究的就是从数据形成知识的过程
•通过假定设想、分析建模等处理方法,从数据中发现
可使用的知识、改进关键决策过程
•数据科学的最终产物是数据
产品
•表现为一种发现、预测、服务、
推荐、决策、工具或者系统。
数据、信息和知识
•数据科学的目标:从数据中发现知识
•数据是世界的特征表现
•零散的符号,数字、文字、声音、图像等
•经过组织和处理后,数据被抽象为信息
•有价值的数据称为信息
•知识是对某一个主题的理论或实际的理解
知识
信息
数据
室外很冷,
室外温度为
室外很冷那么要穿一
2°C
件厚衣服
数据科学的知识结构
•新兴跨领域综合性学科
•继承了各领域数十年甚至数百年的工作成果,包括统计
学、计算机科学、数学、工程学以及其他学科
•领域专长
•从事数据工作的人员需要了解数据来源的业务领域,
您可能关注的文档
- 数控机床故障诊断与维修 课件全套 石秀敏 项目1--8 概述、数控系统无法启动- 机床检测技术在维修中的应用.pptx
- 《电子商务基础与实务》(双色2版)-习题答案 白东蕊.docx
- 《电子商务基础与实务》(双色2版)-习题答案 白东蕊.pdf
- 数据科学技术与应用——基于Python实现(第2版)课件 2-多维数据与计算.pdf
- 数据科学技术与应用——基于Python实现(第2版)课件 3-数据汇总和统计.pdf
- 数据科学技术与应用——基于Python实现(第2版)课件 4-数据可视化.pdf
- 数据科学技术与应用——基于Python实现(第2版)课件 5-机器学习建模分析.pdf
- 数据科学技术与应用——基于Python实现(第2版)课件 6-神经网络与深度学习.pdf
- 数据科学技术与应用——基于Python实现(第2版)课件 7-文本数据处理.pdf
- 数据科学技术与应用——基于Python实现(第2版)课件 8-图像数据处理.pdf
文档评论(0)