- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
谷歌云计算师资培训课程邀请函.doc.doc
谷歌(Google
您好!
时 间:2009年11月30日~12月5日,共6天;每天上午9:00-下午5:00
地 点:清华大学(具体地点在培训确认函中给出)
邀请对象:高校计算机专业和软件工程专业,从事相关课程的授课教师
培训内容:
本培训将基于谷歌(Google)公司与清华大学合作开设的有关集群分布式编程的课程。通过本课程的学习,学员将深入了解到通过大规模集群的模式处理海量数据的方式与编程方法。通过实践相关的课程内容,使用开源的Apache Lucene Hadoop工具,学员将亲身实践Google文件系统以及Google所使用的分布式编程方式MapReduce。学员还需要完成特定的分布式应用程序设计来巩固所学的编程知识,用于处理实际的海量数据问题。课程详细内容请参考附件。
预备知识:
阅读 Google MapReduce 技术论文: /papers/mapreduce-osdi04.pdf
Multithreaded programming
Java programming,
Eclipse environment, a working knowledge of Linux
培训讲师:清华大学陈康等老师,三年开设该课程的经验
费用安排:谷歌将负担培训期间的住宿、食宿费用(11月30日-12月5日)、场地和设备租赁费用、教材费以及讲师费等。但来回差旅费用请学员(学校)自理。
请有兴趣在云计算方面进行课程建设的老师,按照后一页的报名回执,填写信息之后反馈回谷歌公司:helenhu@ .
谷歌中国大学合作部
2009年10月28日
回执:
Google(谷歌) 名 学校名称 教授课程 手机号码 电 话 E-mail 姓 名 学校名称 教授课程 手机号码 电 话 E-mail 联系人信息 姓 名 电话 手机 E-mail 胡斐然 010-6250-4405helenhu@
附件、
课程简介:
本课程是Google公司与清华大学合作,在清华大学开设的有关集群分布式编程的课程。通过本课程的学习,学员将深入了解到通过大规模集群的模式处理海量数据的方式与编程方法。通过实践相关的课程内容,使用开源的Apache Lucene Hadoop工具,学员将亲身实践Google文件系统以及Google所使用的分布式编程方式MapReduce。学员还需要完成特定的分布式应用程序设计来巩固所学的编程知识,用于处理实际的海量数据问题。
课程内容:
1 课程简介
主要讲述分布式编程的模式,分布式编程所需要涉及到的相关知识,包括分布式的应用问题,并行与分布的基础,分布式的历史,并行编程与同步等的相关内容。
2 MapReduce编程技术
主要讲述有关MapReduce编程技术的来龙去脉,相关的理论与技术实现,包括函数式编程语言的简介,大规模数据处理,MapReduce的编程模型,MapReduce编程实例,在实际编程中的错误处理以及优化等相关内容。
3 分布式系统的层次
这一节的内容是对分布式编程内容的简介,包括网络的基本处理,远程过程调用,事务处理系统的工作流程,可靠性等方面的内容。
4 分布式文件系统
分布式文件系统是分布式编程的一块重要的内容,是构建上层应用的基础,用来存储各种应用的数据。本节的内容包括文件系统简介,网络文件系统NFS以及AFS相关的内容,Google使用的GFS(Google File System)等相关的内容。
5 其它的分布式系统
将通过具体的例子来讲述在实际的可运行的分布式系统的内部结构,内容包括域名系统,BOINC系统,PlanetLab等,这些内容为学员将来的研究提供入门的知识。提高的内容还包括google所使用的分布式锁技术Chubby以及分布式的结构化数据处理方法BigTable。
实验内容
除了上述的授课内容外,本课程的特色之处在于有一系列的实验作为支撑内容,使得学员能够在课堂学习之外通过动手实践获得对于分布式编程的实践经验。实验内容分为两个部分,一部分是固定内容,是教材中设计好的实验方案,学员按照要求设计相应的算法;另外一部分是学员自选的内容,学员按照要求提出自己的设想,形成一个比较大的项目,最后通过完成这个项目达到巩固所学知识的目的。
实验一:倒排索引实验
倒排索引是所有搜索引擎的基础,将一个文档中出现的单词以及相关的文档编号联系在一起,以便在检索的时候能够达到快速搜索的目的。本实验通过让学员对Wikipedia的数据进行倒排索引,使得学员初步具有使用分布式环境进行大规模文档索引的基本技能。
实验二:图算法PageRank的实现
图算法PageR
文档评论(0)