大数据和大数据时代可能对我们提出的要求.pdf

大数据和大数据时代可能对我们提出的要求.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据和大数据时代 可能对我们提出的要求 孙茂松 清华大学计算机性科学与技术系 第15届全国高校计算机 院长/系主任论坛 西安交通大学,2012年10月13 日 1 MLN验证式推理(结合三国历史) IDC数据显示,2011年全球新增数据量达1.8ZB (或1.8万亿GB ),这 相当于中国每个人每分钟发送3条微博且连续6,217年不间断。 一、大数据:教学 3 课程体系 • 大数据的存取与管理 = 云计算、并行计算… • 大数据的分析 = 机器学习、大数据挖掘… • 当单机成为计算器…… • 课组建设 -- 市场最需要的人才 -- ‚入云龙‛ -- 巧克力与诺贝尔奖 -- SIGKDD2012: Summer School of Mining the Big Data -- 是否需要进入核心课体系中? 清华计算机系相关教学实践 • 专业实践课程 ‚分布式编程与数据处理‛ -- 早在2007年,我们认识到对大数据的处理将会是学生专 业能力训练的一次实质性跃升。 -- 课程主题定位为‚基于大规模集群的海量数据处理技 术‛,并与掌握最前沿技术的谷歌公司合作。 -- 学生在课程中深入学习了Google文件系统及Google分布 式编程方法MapReduce,并用于处理实际的海量数据问题, 如传染病人群传播模式模拟、统计气象预报、心电图数据分 析、跨论坛热门信息检索、图片搜索等。Google总部、华盛 顿分部、Google中国公司的部分员工参加了最后的大实验总 结会。学生的项目创意和完成情况受到好评,有很多项目被 认为具有研究生水平。 -- 还举办了课程的全国著名高校研讨班,教师来自北京大 学,上海交通大学,浙江大学,中山大学等24所高校,效果 很好。 清华计算机系相关教学实践 • 专业方向课程 ‚高性能计算前沿技术‛ -- 随着处理器多核/众核时代的到来,并行计算将发展成为一门 通用计算技术。本课程与多核/众核技术执牛耳者——Intel公司 合作。 -- 举办了课程培训班,2008-2010年累计培训来自全国重点高校 任课教师97人次,为多核课程的推广和质量提升创造了条件 二、大数据:科学研究 7 Google Translate Twitter用于确定明星位置 -- JustS与Twitter合作,获取每天超过5000万条公开tweet信息,使用自 然语言技术筛选包含明星动向的tweet信息,确定明星目前所在位置。将覆盖 7000位明星 -- Human-Cyber-Physical Systems: 人肉传感器 清华计算机系相关研究(孙茂松教授) • 清华计算机系相关研究(孙茂松教授) • “他有张小清新的脸” “他 有 张小清 新 的 脸 ” 清华计算机系相关研究(朱小燕教授) Original Query How to improve my English? Similar Questions • How I improve my English? • How can I improve my English? • How can I improve my oral English? • How can I improve my English fastly? • How can I improve my spoken English? • Guy

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档