- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
交通数据分析基础;课程介绍:交通数据分析基础;课程介绍:交通数据分析基础;第1章绪论;;;;;;;;;;;;;;;;;;;;;;;第2章交通数据的获取、导入及数据预处理;;;;;;;;第3章交通数据的描述;;;;39;;;;;;;;;;;;;;;;;;;;;;第4章抽样分布;;;;;;;;4.2连续分布;4.2连续分布;4.2连续分布;4.2连续分布;4.2连续分布;第5章交通数据的统计推断;;;;;;;;;;故a和b的矩估计量为:;;;最大似然估计;例子甲(国家级射手)、乙(普通射手)两人射击同一目标,每人各打一发,结果有一人击中目标,你认为是谁射中的?;用样本估计总体的未知参数时,挑选合适的未知参数的取值,使得样本值出现的概率最大。;若总体X为离散型,其分布律为;若总体X为连续型,其概率密度为;最大似然估计法
对固定的样本值,在参数空间中选取使似然函数达到最大的参数值作为参数θ的估计值(称为最大似然估计值),记作;求最大似然估计值的步骤:;;;小结;点估计标准;无偏性;;有效性;;一致性(相合性);备择假设没有特定的方向性,并含有符号“?”的假设检验,称为双边检验或双尾检验(two-tailedtest)
备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单边检验或单尾检验(one-tailedtest)
备择假设的方向为“”,称为左边检验
备择假设的方向为“”,称为右边检验;均值的假设检验;均值的假设检验;方差的假设检验;例:某公交公司想要了解男性司机和女性司机在驾驶速度上是否存在显著差异。于是,该公交公司独立地抽取了两组具有相似驾驶经验的男、女司机的驾驶速度作为样本,并记录下两组样本的数量、均值等资料,具体如下。已知男、女司机驾驶速度的方差,在显著性水平为0.05的条件下,能否认为男性司机和女性司机在驾驶速度上存在显著差异?;5.2假设检验;假设检验中显著性水平是事先给定的,拒绝域实际上也事先给定了。
同一个检验问题可能在不同的显著性水平下作出相互矛盾的决策。
对于一个特定的假设检验问题,α给出了检验结论可靠性的一个大致范围,但却不能对原假设和观测数据之间的不一致程度进行精确测度。;例:公交公司声称某条公交线路主要服务于老年人的出行,其乘客群众有80%为老年人。为了验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个老年人经常乘坐该公交线路。分别取显著性水平?=0.05和?=0.01,检验该公交线路乘客群众中老年人的比率是否为80%,它们的值各是多少?
;总体比率的检验例题分析;H0:?=80%
H1:??80%
?=0.01
n=200
临界值(c):
;利用P值进行假设检验的步骤;在统计学中,很多统计方法都假设数据是服从正态分布的。例如,参数检验方法(如t检验、F检验、卡方检验等)都要求数据满足正态分布的假设。如果数据不服从正态分布,那么使用这些方法可能会导致结果出现偏差,甚至得出错误的结论。因此,在进行这些统计检验之前,需要先对数据进行正态性检验,以确保数据满足正态分布的要求。
常用的正态性检验的表示方法:
Q-Q图
单样本Kolmogorov-Smirnov检验
Shapiro-Wilk检验;Q-Q图(Quantile-QuantilePlot)是一种用于检验数据是否服从某种理论分布的图形工具。它通过对样本数据的分位数与理论分布的分位数进行比较,帮助评估数据是否服从特定的统计分布。
绘制Q-Q图的步骤如下:
排序样本数据:对样本数据从小到大进行排序。
计算分位数:对于排序后的样本数据,计算每个样本点的累积分布函数值。
计算理论分布的分位数:根据选定的理论分布,计算与样本分位数相对应的理论分位数。
绘制散点图:以样本分位数为纵坐标、理论分布的分位数为横坐标,在直角坐标系中绘制散点图。
分析图形:图中通常会绘制一条45°的对角线(理论分布的分位数等于样本数据的分位数),用于比较;如果样本数据的分位数大致沿着对角线分布,则说明样本数据服从理论分布;如果偏离对角线,则可能说明数据不服从理论分布。;单样本Kolmogorov-Smirnov(K-S)检验比较样本的经验累积分布函数(ECDF)和指定理论分布的累积分布函数(CDF)之间的差异,主要通过计算它们之间的最大绝对差值(KS统计量)来评估样本数据是否符合理论分布。如图5-10所示,CDF如果与ECDF之间的差异过大,即认为样本不服从理论分布。;;;非参数检验是一类不依赖数据分布假设的统计检验方法,通常用于数据不满足正态分布假设的情况,或者当样本量较小、数据为顺序或等级型时。非参数检验对数据的分布形式没有严
文档评论(0)