- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据和大数据时代
可能对我们提出的要求
孙茂松
清华大学计算机性科学与技术系
第15届全国高校计算机
院长/系主任论坛
西安交通大学,2012年10月13 日
1
MLN验证式推理(结合三国历史)
IDC数据显示,2011年全球新增数据量达1.8ZB (或1.8万亿GB ),这
相当于中国每个人每分钟发送3条微博且连续6,217年不间断。
一、大数据:教学
3
课程体系
• 大数据的存取与管理 = 云计算、并行计算…
• 大数据的分析 = 机器学习、大数据挖掘…
• 当单机成为计算器……
• 课组建设
-- 市场最需要的人才
-- ‚入云龙‛
-- 巧克力与诺贝尔奖
-- SIGKDD2012: Summer School of Mining the Big Data
-- 是否需要进入核心课体系中?
清华计算机系相关教学实践
• 专业实践课程 ‚分布式编程与数据处理‛
-- 早在2007年,我们认识到对大数据的处理将会是学生专
业能力训练的一次实质性跃升。
-- 课程主题定位为‚基于大规模集群的海量数据处理技
术‛,并与掌握最前沿技术的谷歌公司合作。
-- 学生在课程中深入学习了Google文件系统及Google分布
式编程方法MapReduce,并用于处理实际的海量数据问题,
如传染病人群传播模式模拟、统计气象预报、心电图数据分
析、跨论坛热门信息检索、图片搜索等。Google总部、华盛
顿分部、Google中国公司的部分员工参加了最后的大实验总
结会。学生的项目创意和完成情况受到好评,有很多项目被
认为具有研究生水平。
-- 还举办了课程的全国著名高校研讨班,教师来自北京大
学,上海交通大学,浙江大学,中山大学等24所高校,效果
很好。
清华计算机系相关教学实践
• 专业方向课程 ‚高性能计算前沿技术‛
-- 随着处理器多核/众核时代的到来,并行计算将发展成为一门
通用计算技术。本课程与多核/众核技术执牛耳者——Intel公司
合作。
-- 举办了课程培训班,2008-2010年累计培训来自全国重点高校
任课教师97人次,为多核课程的推广和质量提升创造了条件
二、大数据:科学研究
7
Google Translate
Twitter用于确定明星位置
-- JustS与Twitter合作,获取每天超过5000万条公开tweet信息,使用自
然语言技术筛选包含明星动向的tweet信息,确定明星目前所在位置。将覆盖
7000位明星
-- Human-Cyber-Physical Systems: 人肉传感器
清华计算机系相关研究(孙茂松教授)
•
清华计算机系相关研究(孙茂松教授)
•
“他有张小清新的脸” “他 有 张小清 新 的 脸 ”
清华计算机系相关研究(朱小燕教授)
Original Query
How to improve my English?
Similar Questions
• How I improve my English?
• How can I improve my English?
• How can I improve my oral English?
• How can I improve my English fastly?
• How can I improve my spoken English?
• Guy
文档评论(0)