- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
物理专业应该掌握的计算机技能No.4——运用R做数据分析.pdf
物理学家应该掌握的计算机技能 No.4——运用 R 做数据分析
author:fame
1.什么是 R ?
在 R 的官方教程里是这么给 R 下注解的:一个数据分析和图形显示的程序设计环境(A system fo
data analysis and visualization which is built based on S language.)。当然这个解释还是比较
难解。笼统的讲,R 是一个可以和 SPSS ,SAS 这些商用软件对抗的统计软件。我第一次接触到 R 就是在
2011 年暑假,南京大学和 Hopkins 大学联合举办生物统计的暑期课程。在第一节课上,助教就展示了
关于 R 的用法和思路。虽然那是一个暑假课程但 Hopkins 大学的老师一样很深入的讲了 R 的使用。印象
最深刻的是关于用 R 来做基因组序列分析的实验部分。从那以后我对 R 就很喜欢,甚至很多的实验都是
借助 R 来完成的。
R 其实是 Rick Becker,John Chambers 和 Allan Wilks 开发的 S 语言的一种实现,这三个人都在
贝尔实验室工作,他们合作开发了 S 语言来进行统计的运算,并且开发了商用的 SPLUS。关于 R 的历史,
大家可以 google。
简而言之, R 是一个开放、开源、共享的软件系统,借助它你可以实现几乎所有的统计和计算工作 ,
甚至有人用 R 来做模拟和分析。R 有着开源软件共有的特点,拓展包多,借助各种拓展包,你可以实现
从生物上的基因序列分析到商业上网站访问的聚类分析。同时任何人都可以自由的使用、分享 R 而不需
要担心版权的问题,这大大促进了 R 的发展。正如 Hopkins 的老师说的:“Not all people can
afford the cost of using SPSS or SAS even though they are easy to start with.” 当然在中国
这点并不是特别重要,但是可怕的是如果你和外国同学交流或者你有机会出国的时候却发现没法和大家
交流因为你使用的是盗版软件而别人很多在使用开源的软件,你却都没有听说过。更可怕的是当我们环
顾图书馆的藏书时候发现好多都是在讲怎么用 SPSS 和 SAS 的,老师上课也是这么教同学的,这样的循
环是可怕的。因为大家永远也接触不到开源软件的魅力与开源的精神。
同时,或许在 学,商业领域SPSS 们可以和 R 相匹敌,但是在生物统计或者大规模数据分析上 R
可以说是一骑绝尘,鲜有敌手。因为这些需要高度专门性的领域,R 这样可以编程,自由修改的软件系
统绝对是适用的。
2. 安装R
2.1windows 环境
在 Google 直接输入 R,第一个搜索结果就是 R project 的官网(这就是我喜欢 google 的地方,客观公
正而不是所谓的用钱可以买到的凤巢)或者去:http://cran. -/mi ors.html,选择一个镜像地址
访问,下载Precompiled Binary Distributions 中的软件。如果是 Windows 用户,可以点击Windows (95
and later),进入 base,选择rwxxxx.exe 下载,很快就可以下载好,然后安装一般的 windows 下的安装程序
安装,除了语言一般选择默认的配置就可以使用 R 了。
然后可以下载RStudio 这个软件,它可以把R 的界面改装成和 Matlab 类似的界面,工作空间,内存
空间,结果和软件包展示区,相当的方便。
Illustration 1: RStudio
2.2Linux环境
在 ubuntu 的环境下主要是使用 RKWard 这样的类似编辑环境,当然在 Linux下也是可以用 Rstudio
的只是要去官网上下载deb 的包。我直接展示了同样的 R 程序在 RKWard 下的默认的效果图。
Illustration 2: RKWard
可以看到也可以直接显示数据同时进行操作,当然也可以使用命令行的模式运行 R。
3.R 的语法
3.1 数据结构
首先注意,R 是大小写敏感的。其次在 R 中基本的数据结构
文档评论(0)