- 13
- 0
- 约1.95万字
- 约 37页
- 2019-02-11 发布于天津
- 举报
cncc大数据报告(ccf网站用)37
CNCC大数据论坛
大数据对计算机系统的挑战
李国杰
中国科学院计算技术研究所
2013 年10月,长沙
针对大数据应用,计算机
系统结构需要革命性的重构
计算机系统结构需要革命性的重构
历史上设计计算机系统的主要目标是充分发挥CPU的计算
性能,较少关心如何满足持续的数据存取要求。存储墙问
题尚未解决,又遇上大数据应用,计算机系统的负载发生
了本质性变化,计算机系统结构需要革命性的重构。
信息系统需要从数据围着处理器转改变为处理能力围着数
据转,关注的重点不是数据加工,而是数据的搬运;系统
结构设计的出发点要从重视单任务的完成时间转变到提高
系统吞吐率和并行处理能力,并发执行的规模要提高到10
亿级以上。构建以数据为中心的计算系统的基本思路是从
根本上消除不必要的数据流动,必要的数据搬运也应由
“大象搬木头”转变为“蚂蚁搬大米” 。
数据中心计算机与高性能计算机的区别
应用负载特征 任务的 性能 可靠性 性能
并行度 成本 要求 目标
要求
高通量计 网络服务 固有充 成本决 单个部件失 高通量:
算系统 海量规模:EB级数据, 定服务 效对应用影 提高单位
(数据中心) 亿级并发 足的线 提供者 响不大。不 时间内处
任务多样:负载频繁变化 程级并 的生存 同性质数据 理的并发
,单个任务计算量不大 和收益 有不同的可 任务数目
局部性差:服务实例内部 行性 靠性要求:
相关性高,不同服务实例 如可再生数
之间相关性低 据和用户数
据可靠性的
差异
高性能计 科学和工程计算 需要用 优先追 单个部件失 高速度:
任务单一:负载变化不频 适当的 求性能 效可能导致 缩短单个
算系统 繁,单个任务计算量大 方法挖 ,再兼 整个应用计 并行计算
(应用) 顾成本 算停顿,需要 任务的运
局部性好:计算集中于若 掘出可 用检查点技
干核心任务,局部性有利 利用的 术来保存中 行时间
于加速核心计算速度和提 并行性 间计算结果
以恢复计算
高数据带宽、 过程。
4
从高性能计算机到高通量计算机
您可能关注的文档
- 2018年成本会计培训课件.ppt
- 2018年成功的职业销售技能.ppt
- 2018年心灵密码解析.ppt
- 2018年成本控制培训课件.ppt
- 2018年战略地图平衡计分卡案例.ppt
- 2018年怎样做一名优秀的品管部主管.ppt
- 2018年战略管理培训教材3.ppt
- 2018年战略咨询培训手册.ppt
- 2018年成本报表的编制和分析课件.ppt
- 2018年战略概述与基本框架.ppt
- 碳排放总量控制制度设计理论与实践 课件 第5章 国家自主贡献.pptx
- 任务6-2 PC控制数码管显示(中断方式).pptx
- 网络综合布线系统工程(活页式)(微课版) 课程标准 .docx
- 传感器技术 课件 -第4章 光传感器.pptx
- 工业数字孪生 课件 项目6 智能分拣单元工业数字孪生实战.pptx
- 《敬业教育》课件 第3、4章 尽责与精业、创新与奉献 .pptx
- 中国哲学智慧(第4版)课件 第五章 近代新学.pptx
- 碳排放总量控制制度设计理论与实践 课件 第3章 行业企业碳排放统计核算.pptx
- 《地方财政学》(第六版) 课件 第六章 地方财政支出.pptx
- 人工智能训练师 课件全套 第1--8章 人工智能概述 --- 人工智能的伦理与法规.pptx
原创力文档

文档评论(0)