- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据分析中数理统计方
法的正确使用
92、火龙果整
uml. org. cn
重要假定
令作者所处理的数据属于随机变量的特定样本
作者已经掌握最基本的数理统计学常识,如概率、
假设检验、均值、方差、标准差、正态分布、相
关分析、回归分析、方差分析…
9、火龙果
o uml. org. cn
数理统计问题的重要性
令在科学研究中,经常会涉及到对随机变量大小、离散及分布
特征的描述以及对2个或多个随机变量之间的关系描述问题。
地学、环境科学研究也不例外
今对随机变量及随机变量之间的关系进行定量描述的数学工具
就是数理统计学。
令在科学研究中,能否正确使用各种数理统计方法关系到所得
出结论的客观性和可信性。所以,来稿中使用的数理统计方
法是否正确应是学术期刊编辑和作者极为重视的问题
今目前,国内科技期刊对稿件中数理统计方法问题的重视程度
存在差异
92、火龙果整
o uml. org. cn
1统计软件的选择
令统计分析通常涉及大量的数据,需要较大的计算
工作量
令在进行统计分析时,尽管作者可以自行编写计算
程序,但在统计软件很普及的今天,这样做是毫
无必要的。
令出于对工作效率以及对算法的通用性、可比性的
考虑,一些学术期刊要求作者采用专门的数理统
计软件进行统计分析。
9、火龙果
o uml. org. cn
1统计软件的选择
问题:作者未使用专门的数理统计软件,而采用
Exce这样的电子表格软件进行数据统计分析
由于电子表格软件提供的统计分析功能十分有限
只能借助它进行较为简单的统计分析,故我们不主
张作者采用这样的软件进行统计分析。
Q火龙果整
1统计软件的选择
显件晨雾,昆發
出的专门用于统计分析的商
名有SPSs( Statistical Package
for Social Sciences) ASAS(Statistical Analysis
Systen)。此外,还有BMDP和 STATISTICA
等
SPSS是专门为社会科学领域的研究者设计的,但
此软件在自然科学领域也得到广泛应用
BMDP是专门为生物学和医学领域研究者编制的
统计软件。
92、火龙果整
o uml. org. cn
1统计软件的选择
冷目前,国际学术界有一条不成文的约定:凡是用SPSS
和SAS软件进行统计分析所获得的结果,在国际学术
交流中不必说明具体算法。由此可见,SPSS和SAS软
件已被各领域研究者普遍认可。
心我们建议作者们在进行统计分析时尽量使用这2个专
门的统计软件。目前,有关这2个软件的使用教程在
书店中可很容易地买到。
9、火龙果
o uml. org. cn
2.1均值的计算:理论问题
令1)均值(准确的称呼应为“样本均值”)的统
计学意义:反映随机变量样本的大小特征。
2)均值对应于随机变量总体的数学期望一总体
的数学期望客观上决定着样本的均值,反过来
通过计算样本的均值可以描述总体的数学期望
92、火龙果整
uml. org. cn
2.1均值计算:理论问题(续)
令3)在处理实验数据或采样数据时,经常会遇到
对相同采样或相同实验条件下同一随机变量的多
个不同取值进行统计处理的问题。
4)为找到代表这些观测值总体大小特征的代表
值(统计量,该统计量根据样本数据算出),多
数作者会不假思索地直接给出算术平均值和标准
差。显然,这种做法是不严谨的—不一定总是
正确的
QQ火龙果整理
o uml. org. cn
2.2均值计算:技术问题
今在数理统计学中,作为描述随机变量样本的总体大
小特征的统计量有算术平均值、几何平均值和中位数
等多个。
心何时用算术平均值?何时用几何平均值?以及何时
用中位数?这不能由研究者根据主观意愿随意确定,
而要根据随机变量的分布特征确定。
92、火龙果整
uml. org. cn
原创力文档


文档评论(0)