- 76
- 1
- 约6.1千字
- 约 8页
- 2016-11-24 发布于浙江
- 举报
数据分析常用的基本概念:概率、假设检验
概率
(1)分布函数:描述一个随机变量X,不仅要说明它能取哪些值,而且还要关心它取这些值的概率。对任意的实数x,令,则称为随机变量X的分布函数,也成为累积分布函数。
分布函数是定义在上的实值函数,在点x处取值为随机变量X落在区间上的概率。如果随机变量X的全部可能取值只有有限多个或可列无穷多个,则称X为离散型随机变量。
离散型随机变量X可能取值为的概率为:称为离散型随机变量X的分布律。
离散型随机变量的分布函数为:
对于随机变量X,如果存在一个定义在上的非负函数,使得对于任意实数x,总有:,
则称X为连续型随机变量,为X的概率密度函数,简称概率密度。
(2)常用的分布函数:正态分布、二项分布、Poisson分布、指数分布
1)正态分布:若随机变量X的概率密度函数为:
,
其中,和为两个常数,则称X服从参数为和的正态分布,也称为Gauss分布,记作,若,则,
2)指数分布:若随机变量X的概率密度函数为:
其中为常数,则称X服从参数为的指数分布,其分布函数为:,特别指出:,即为指数分布的数学期望。
3)二项分布:若随机变量X的分布律为
原创力文档

文档评论(0)