面向统计研究的R编程.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

个人简介

Kaggle比赛

HiggsBosonMLChallegeHiggsBosonML比赛HiggsBosonML比赛中要求参赛者在利用29个变量去对实验事件进行分类,将有物理意义的实验现象和背景噪声分开。

我的几次尝试图1提交Kaggle的成绩统计图,不同颜色表示不同的模型

Kaggle比赛的总结一个正确的模型还是很重要的!不过数据量还是可以压倒很多事情的!但是数据量上去了,计算能力也要上去啊!

统计研究的一种思路

带有SmartArt的标题和内容版式明确问题了解背景知识大致了解数据提出猜想问题的假设可能的解决方案验证猜想制定可行的研究方案数据实现修正方法和猜想总结成文写论文写博客

问题:编程难在哪里?

数据结构设计之难

我第一次修改R包的经验mvpart是实现多元分类树算法的一个R包,从rpart包发展而来(主要是在rpart的基础上添加了针对相应变量为多元变量的算法)图2mvpart包中定义树结构的头文件

我第一次创建R包的检验这是后来的开发的另外一个基于树算法的R包——edtree。用了S3类。利用list可以方便地在Rcpp中方便地转换。图3edtree中定义树结构的R代码

总结学术研究过程中的编程工作有着如下的特点:与工程界相比,代码规模一般更小;要求一定的可复用性;一定的软件工程能力是需要的设计适合的数据格式

Debug之难

最近的一个比较奇怪的例子图4图中提示找不到名为’PRI_tau_pt’的函数对象,但实际上’PRI_tau_pt’是用到的数据中的一个变量名。

建议与实例无他,唯手熟尔

善用搜索引擎

从修改别人的包开始

修改他人的包的好处学习良好的数据结构设计一定程度上减少工作量代码复用数据结构的一致性减少重构的代码量

使用好的工具

强大的Rstudio图4Rstudio集成了debug、文档生成和版本控制工具,堪称R语言开发瑞士军刀。

Rcpp:R与C++的桥梁Rcpp的优点:数据结构与R相似;自动的内存管理;扩展性强;图5SeamlessRandC++IntegrationwithRcpp本书中文版即将出版

清洗数据的能力

清洗数据有时候挺麻烦的表1一份来自临床医生的实验数据

Thankyou

您可能关注的文档

文档评论(0)

183****2083 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档