- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据工程实验室申报书
大数据工程实验室申请书
1.工程实验室拟突破的技术方向
大数据工程实验室拟突破的技术方向为:R语言与Hadoop分布式计算平台交互技术。
R语言一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发(也因此称为R),现在由“R开发核心团队”负责开发。R的源代码可自由下载使用,可在多种平台下运行,包括UNIX,Linux,Windows和MacOS。R主要是以命令行操作为主,同时支持GUI的图形用户界面。R内建多种统计学及数字分析功能R比其他统计学或数学专用的编程语言有更强的物件导向功能。R的另一强项是绘图功能,制图具有印刷的素质,也可加入数学符号。虽然R主要用于统计分析或者开发统计相关的软体,但也有人用作矩阵计算。其分析速度可媲美GNU Octave甚至商业软件MATLAB。CRAN为Comprehensive R Archive Network的简称它除了收藏了R的执行档下载版、源代码和说明文件,也收录了各种用户撰写的软件包。全球有超过一百个CRAN镜像站,上万个第三方的软件包。R的应用统计分析,应用数学,计量经济,金融分析,财经分析,人文科学,数据挖掘,人工智能,生物信息学,生物制药,全球地理科学,数据可视化。可移植操作系统接口自2006年,Hadoop以MapReduce和HDFS独立发展开始,到今年2013年不过7年时间,Hadoop的家族已经孵化出多个Apache的顶级项目。特别是最近1-2年,发展速度越来越快,融入了很多新技术(YARN, Hcatalog, Oozie, Cassandra)。Hadoop家族的强大之处,在于对大数据的处理,让原来的不可能(TB,PB数据量计算)成为了可能。R语言的强大之处,在于统计分析,在没有Hadoop之前,我们对于大数据的处理,要取样本,假设检验,做回归,长久以来R语言都是统计学家专属的工具。hadoop重点是全量数据分析,而R语言重点是样本数据分析。 两种技术放在一起,补短以计算机开发人员的思路,所有事情都用Hadoop去做,没有数据建模和证明,预测的结果”一定是有问题的以统计人员的思路,所有的事情都用R去做,以抽样方式,得到的“预测的结果”也一定是有问题的。hadoop使得R语言具有处理高达TB甚至PB级的大数据的能力。在GitHub社区可以找到该项目与开源实现代码。Rhadoop包含有三个包,分别是rhdfs,rmr以及rHBase,分别对应Hadoop系统架构中的HDFS, MapReduce和Hbase三个部分。除了Rhadoop之外,还有从R中进行Hive查询的Rhive包,能够直接从Hive中进行查询。
将R和结合起来,其既能够利用分布式计算打破数据量的限制,又能够利用R中的众多优秀的免费扩展包,快速实现所需的数据处理分析。
综上所述,R语言与Hadoop的交互使用技术就成了本项目急需突破的技术方向。
2.工程实验室的主要功能与任务
大数据工程实验室的主要功能如下:
(1)为学科思贤若渴为学科相关科研课题的研究提供支撑在保证完成学校教学任务的前提下,面向学校及社会开放,为相关科研课题研究提供支持。为相关科研课题的研究提供大量、详实的数据。为相关科研课题的研究提供数据处理与分析工具。
在一定程度上为社会提供相关服务可以为社会有关单位和个人提供可以进行设计、开发、培训,真正实现产、学、研的有机结合学科hadoop的R程序包,申请国家专利,继而把R程序包上传国际CRAN镜像站
您可能关注的文档
最近下载
- 绿城好房子体系.pptx
- AI在计算机科学教学中的应用论文.docx
- 人教版七年级历史下册期末试卷(含答案).pdf VIP
- 员工手册电子版员工手册电子版.doc VIP
- 【高考数学押题卷】2025年全国100所名校高考模拟示范卷七含答案或解析.pdf
- 孚瑞肯FR100系列变频器使用说明书.pdf
- 开放系统22226《物业管理实务(2)》期末机考真题及答案(第101套).docx
- 武侯区2018-2019学年五年级下数学调考试卷-.pdf VIP
- 尪痹(类风湿关节炎)中医护理效果评价表.docx VIP
- J B-T 10441.3-2004 电工用皱纹绝缘纸 第3部分 技术要求.pdf VIP
文档评论(0)