- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据时代R语言模拟在概率统计课程教学中应用
大数据时代R语言模拟在概率统计课程教学中应用
摘要:大数据时代,概率统计课程作为数据科学重要的核心课程之一,如何更好地进行课堂讲授成为许多专家学者关注的问题。基于R软件的sample函数,对概率统计课程中的经典案例掷骰子进行模拟,对虚拟的骰子进行不同次数的投掷,并对投掷结果进行分析,指出统计规律性及其重要性。该模拟过程可以激发学生的学习兴趣,培养学生的动手能力,达到理论与实践相结合的课程教学目标。
关键词:概率统计;骰子;R语言;模拟
随着经济、科技的快速发展,人们对信息精确化程度的要求越来越高,大数据的发展成为信息时代发展的必然趋势。概率统计课程作为数据科学的核心课程之一,引发了许多专家学者对大数据时代的概率统计教育教学献言建策。比如,赵彦云对我国统计教育进行了回顾与展望,指出运用统计思想和统计方法,让大数据的价值最大;白雪梅和刘志龙对我国应用统计学专业及统计行业进行分析,指出大数据只有在统计学这门工具属性学科的帮助下才能发挥其自身的作用,并对国内外统计实践教育方法进行比较;孟生旺和袁卫对大数据时代美国统计学会发布的统计学本科专业指导性教学纲要的核心内容进行了简单介绍,对我国统计类本科专业教育存在的问题进行剖析,指出了教学内容要突出数据的重要性,并建议在教学中使用专业的统计软件R。R语言是免费使用的,而且其源代码是开放的,这些特点使其已经成为概率统计教学中的标准语言之一,也成为国内外各大专院校开设的统计软件课程之一。笔者结合多年的概率统计实践教学经验,以R语言为工具,通过模拟概率统计常用的掷骰子实验,以更好地理解统计规律的思想及其重要性。
一、R语言简介
R语言最初由Auckland大学的Robert Gentleman和Ross Ihake及其他志愿者合作开发,是对S语言统计编程语言的集成。R语言是一种用于统计计算和绘图的编程语言和环境,是一种交互式编程语言,因为其免费使用且开源,已经成为统计分析和数据分析的全球化通用语言。如果在百度中输入一个字母R,就会有将近1亿个相关条目,而且有丰富的R语言学习资料。R语言还在持续发展中,而且还得到了CRAN(Comprehensive R Archive Network)社区的支持,在这里既有数据科学家也有程序员,他们很愿意为R语言用户提供帮助。
二、R语言模拟骰子
?S骰子作为研究随机现象的一个经典实例,受到很多概率统计教材的青睐,在介绍随机现象及样本空间的概念时,教师可以通过该实例帮助学生理解随机现象的随机性和所有可能结果的已知性。
我们知道,均匀的骰子具有六个面,分别刻有一个点、两个点直到六个点,而掷一枚骰子出现的点数则是1到6之间的某个正整数,而掷一个骰子所有可能的结果构成的集合为Ω={1,2,3,4,5,6},一般称“Ω”为掷骰子这个试验的样本空间。
基于上述的分析,我们可以构造一个具有这1到6的整数向量,并将其值赋给变量dice,即dice-c(1,2,3,4,5,6),则dice为一枚虚拟的骰子,具有6个值。那么,如何让这个虚拟的骰子像真实的骰子一样,每投掷一次,产生一个点数?下面,我们结合R语言中的sample函数,让这个虚拟的骰子和真实的骰子一样,可以产生点数。
三、虚拟骰子的运转
首先,现实生活中,每次掷骰子的结果,肯定是样本空间Ω中的一个元素值,且这个值是随机的,并与其他投掷结果相互独立。骰子是均匀的,每个值出现的可能性相同,而且可以在相同条件下连续不断投掷。
由上面的分析,我们可以这样理解:掷骰子产生的结果实际上是从样本空间中随机抽取的结果,每次抽取是相互独立的,而且每一个值被抽到的可能性是相同的。这其实就是统计中的有放回抽样。
基于上述的分析,我们可以利用R语言中的sample函数来处理这个问题。运行下列代码:sample(dice,size=1),就可以得到一个值,这就像掷一次骰子。若连续运行该语句,就好似连续投掷骰子,可以得到不同的点数,而且点数之间是相互独立的。这样,我们就完成了虚拟骰子的构建与运行。为更好地理解统计规律,我们有必要解释一下sample函数。函数sample为“抽样”函数,dice为抽取的对象,size为抽取的样本大小,目前我们模拟的是投掷一枚骰子,故本语句中的size=1,即每次抽一个,只产生一个结果。
四、随机现象的统计规律性
首先,我们将骰子扩展到两枚,即每次产生两个结果,可以运行下列语句sample(dice,size=2,replace=TRUE)。该语句的抽取对象没有变化,但是size=2,表示产生两个结果,因为投掷的是两枚骰子;因现实中两枚骰子产生的结果是相互独立的,故我们设置参数replace=TRUE。
假如班里有60名学
原创力文档


文档评论(0)