- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
R语言与资料分析之资料勘探
R随着BigData热潮,R的身价大翻转,变成了资料科学界眼中的宝。不只是木讷的统计学家熟知它,包括WallStreet交易员、生物学家,以及硅谷开发者,他们都相当熟悉R。多元化的公司象是Google、Facebook、美国银行以及NewYorkTimes通通都使用R,它的商业效用持续提高。
S语言S语言,一种用于统计的程序语言,主要用于统计运算,它在1975年至1976年间在贝尔实验室(BellLaboratories)被開發出來。由贝尔实验室的约翰·钱伯斯(JohnChambers)、瑞克·贝克尔(RickBecker)与艾伦·威尔克斯(AllanWilks)共同研发。它的目标在于,快速而忠实的将想法转化为软件。当时最主要的统计运算程序,都是直接呼叫Fortran的子程序。但是S语言采用了高度交互式的方法来实作R语言与S-PLUS是它的后继者。
R是什么?「TheRenvironment」是由S语言所转变而来,由贝尔实验室的JohnChambers最初所设计,继而有DouglasBates,RickBecker,BillCleveland,TrevorHastie,DarylPregibon及AllanWilks等人所实践落实及修改。所以事实上Rlanguage就是「新的S语言」。承袭S语言的设计理念,它是一个整合型的资料处理软件及统计软件,同时也是绘图软件。
R是什么?R最初是由来自纽西兰奥克兰大学的RossIhaka和RobertGentleman开发,也因此称为R。现在则由所谓的「R开发核心团队」负责。R大致上的语言方式与S或S-plus语言相通,最大的不同乃在于结果的输出,R仅会显示最少的讯息,但可以将想要输出结果储存为一个物件(object),以提供后续演算,这也是与许多统计软件如:SAS、SPSS不同的地方。
R是什么?由于它是免付费的公开软件,原始码也可自由下载使用,在加上十分容易在官方网站(/)找到别人写好的套件(Package)或分析程序码,因此近年来使用的人越来越多,并且不乏许多专业人士,如:風險分析師、研究学者、统计学家等。R能快速的扩张归功于它的物件导向功能,具有执行使用者自订功能及Package的能力。另外他在程序语汇上的弹性也是容易编辑也成为扩展的优点。
资料科学家在BigData时代下,资料科学家不但被《哈佛商业评论》誉为21世纪最性感(Sexiest)的工作,资料科学家有多「性感」?让我们很现实地从薪资说起。根据美国商业智慧软件公司SiSense调查研究指出,信息分析相关人才起薪约为年薪5.5万美元(约台币180万),换句话说,相较美国大学毕业生平均年薪为4.76万美元,高出7400美元,而最高薪的资料科学家,平均年薪为13.2万美元(约台币440万),打败一票如苹果、高通等大型科技公司的高阶工程师。
资料科学家Gartner报告指出,2018年全球将会有440万个职场新工作与BigData有关;另外,麦肯锡预估,到了2018年,光是美国就需要至少30万个懂得BigData的人才,届时市场至少短缺14~19万个具备深度分析资料的人才!
资料科学家根据一位资料软件相关业者指出,具备资料搜集与分析的硕士毕业生,「起薪起码44K起跳!」他指出,如果有一年至两年经验的资料探勘人才,平均月薪甚至领到七万元,都不是问题,换句话说,当上资料科学家,等于拥有一张年薪百万元的入场券。
资料科学家BigData应用在全球各国发酵之际,伴随而来的问题,就是各国普遍缺乏资料科学家。在台湾,BigData的应用虽然才已经萌芽,但是要面临的几项重大挑战,除了资料分析人才不足之外,其他还有在地顾问服务不足以及对资料价值的敏感度不足的问题,而这些因素都将影响巨量资料在台湾市场的发展。资料科学家的工作职缺,从2011年开始急速攀升,成为前10大热门职缺。这项统计是汇集1千多个人力银行的数百万个职缺结果。
资料科学家
资料科学家当信息科学博士碰上数据时,常常会花太多时间思考用哪种算法,反而忽略一般性问题。象是哪套变量(或特征)比较重要等等。资料科学家康迪多(JohnCandido)说:「我不想贬低博士学历的价值,但我不觉得这是(成为好的资料科学家的)必要条件。」资料分析师和商业情报专家知道要分析哪些资料,但资料科学家的作法更具实验性,他们必须找出资料组合,想出可以从中挖掘出哪些信息,以及如何挖掘。
WhyLearnR?为何学R?BecauseRisoneofthemostdemandedscriptinglanguagedevelopedbyandforstatisticians.R
您可能关注的文档
最近下载
- 基于单片机的智能加湿器设计.doc
- 废旧锂电池资源化利用生产线智能化改造环评环境影响报告书.doc
- TEJCCCSE020-2024 风机塔筒内置式箱变技术要求.pdf
- 齐齐哈尔城市功能的历史变化(1691-1962).pdf
- 人工智能在动漫角色动画中的应用.docx VIP
- (大班主题活动米.doc VIP
- CFA特许金融分析师-CFA一级-09-PortfolioManagement.docx VIP
- 外文文献翻译服装设计.pdf
- CFA特许金融分析师-CFA一级-03-FinancialStatementAnalysis一.docx VIP
- CFA特许金融分析师-CFA一级-衍生.pdf VIP
文档评论(0)