- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实用统计分析方法与应用
现代统计学的研究对象:统计方法和统计逻辑
现代统计学的分类:
从实际应用中的方法来区分可分为
现代统计学概述
1
R
编程
可视
SAS
编程
Eviews
编程
可视
Matlab
编程
可视
SPSS
可视
Stata
可视
Excel
可视
。。。
统计软件
2
常用统计软件一览(3种数据形态)
SPSS的特点:
1:可视化操作,界面友好美观。
2:数据接口多。
3:操作简单,用户体验好。
4:较之Excel数据处理能力更强。
数理统计的基本框架:
3
数理统计的基本框架:
微积分:数学基础,为概率论的运算以及数理统计的统计量提供基础。
概率论:数理统计学所考察的数据都带有随机性(偶然性)的误差。这给根据这种数据所作出的结论带来了一种不确定性,其量化要借助于概率论的概念和方法。
数理统计基础:对数据的结构分析和条件检验。对以数据为基础的计量经济学提供前端分析。
计量经济学:利用建立模型和优化模型解决实际问题的方法。
时间序列分析:是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。
4
数理统计的基本框架:
5
6
随机变量的数学特征
7
随机变量的数学特征
随机变量的分类
定性分类随机变量可分为分类变量和有序变量
定量分类随机变量按数据集是否能够取有限个或至多可列个值,可分为离散型变量和连续型变量。
离散型变量:随机变量X只可能取有限个或至多可列个值
连续型变量:变量可以在某个区间内取任一实数,即变量的取值可以是连续的
随机变量的数学特征
8
分布:分布是形容数据的一类集体形态的特征,分布列或分布函数代表了数据出现在不同位置拥有的不同概率。
离散型随机变量的分布列:表现出每一个随机变量取值及出现的概率
例:
价格
A1(70万)
A2(88万)
A3(108万)
占比
25%
50%
25%
某楼盘当期开盘的户型总价分布列
常见的离散型变量分布:0-1分布,泊松分布
随机变量的数学特征
9
随机变量的数学特征
10
最常用的连续型随机变量分布——正态分布
在统计中,许多重要的分布都是连续型分布,其中一种特别重要的连续型随机变量的概率分布就是正态分布(Normal Distribution)。正态分布最初为 De Moivre于 1773 年发现,其后,拉普拉斯(Laplace)和高斯(Gauss)对它作出了很大的贡献,尤其是高斯的贡献最为突出,所以正态分布又称为高斯分布。
随机变量的数学特征
期望
方差
协方差与相关系数
大数定律与中心极限定理
11
随机变量的数学特征
期望:在概率论和统计学中,一个离散型随机变量的期望值(或数学期望、或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和。
离散型随机变量:
12
以频率为权重的加权平均
随机变量X的数学期望,记作E(X),即
13
例
某楼盘当期开盘的户型总价的分布列
求整个项目的平均价格
随机变量的数学特征
E(X)=70*25%+88*50%+108*25%=88.5
价格
A1(70万)
A2(88万)
A3(108万)
占比
25%
50%
25%
随机变量的数学特征
14
连续型随机变量
设连续型随机变量X的概率密度为 f (x), 则
正态分布的期望
数学期望的意义
15
试验次数较大时,X的观测值的算术平均值
在E(X)附近摆动
数学期望又可以称为期望值(Expected Value),
均值(Mean)
E(X)反映了随机变量X取值的“概率平均”,是X的
可能值以其相应概率的加权平均。
方差的引入
16
E( X1 )=50
E( X2 )=50
设有两个楼盘,其各户型总价取值规律如下:
总价(万元)
占比
两种个楼盘的总价均值是相同的,但楼盘2的波动更大
方差
17
均方差(标准差)
即
方差的计算步骤
18
Step 1: 计算期望 E(X)
Step 2: 计算 E(X2)
Step 3: 计算 D(X)
离散型
连续型
离散型
连续型
协方差
在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
直观上来看,协方差表示的是两个变量总体的误差,这与只表示一个变量误差的方差不同。
如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身
文档评论(0)