- 1、本文档共104页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据的统计与分析的两类方法 1.数据的统计与描述 数据的收集 样本:统计研究的主要对象 总体--研究对象的全体。如所有顾客感觉舒适的高度 个体--总体中一个基本单位。如一位顾客的舒适高度 样本--若干个体的集合。如50位顾客的舒适高度 样本容量--样本中个体数。如50 数据的整理 比较直观,比较清晰的结论 21—50岁的中青年患者大约占总发病人数的 3/4,提醒民众中青年是易感人群。 频数表 平均值 标准差 统计量 示例 随机变量的概率分布及数字特征 频率与概率 概率密度与分布函数 期望和方差 常用的概率分布 MATLAB命令 频率与概率 概率密度与分布函数 期望和方差 常用的概率分布 常用的概率分布 2.参数估计与假设检验 假设检验的MATLAB实现 MATLAB命令使用说明(一例) 3.回归分析 模型 对?1 , ?2非线性 对?1, ?2线性 1/x较小时有很好的线性趋势,1/x较大时出现很大的分散. x较大时,y有较大偏差. 参数估计时,x较小(1/x很大)的数据控制了参数的确定. ?1=6.972?10-3, ?2=0.215?10-3 ?1=143.43, ? 2=0.0308 直接考虑非线性模型 一元线性回归分析 已知一组数据(xi, yi), i=1,2,?n (平面上的n个点), 用最小二乘准则确定一个线性函数(直线) 问题 1. 血压与年龄 2. 合金强度与碳含量 怎样衡量由最小二乘准则拟合得到的模型的可靠程度? 怎样给出模型系数的置信区间和因变量的预测区间? 系数的计算二者没有什么区别; 2的拟合效果比1好得多. 一元线性回归模型 x~自变量 yn y2 y1 xn x2 x1 ~回归系数 ?~随机变量(影响y的随机因素的总和) 独立性: 对于不同的x,y相互独立 线性性: y的期望是x的线性函数 0 x y 基本假设 齐次性: 对于不同的x,y的方差是常数 正态性: 对于给定的x,y服从正态分布 ? 是相互独立的、期望为0、方差为?2、正态分布的随机变量,即? ~N (0, ?2), ? 称(随机)误差。 回归系数的最小二乘估计 数据xi, yi( i=1,?n)代入 误差平方和 直线 通过xi, yi的均值点 最小二乘估计 线性无偏最小方差估计 一元线性回归的统计分析 1.误差方差D? =?2 的估计 yi理论值(期望)的估计 误差?i的估计,称残差(记作ei ) 残差平方和 ?2的无偏估计 n-2~Q的自由度=数据容量 ? 模型中所含参数的个数 s2~剩余方差(样本方差),s~剩余标准差(样本标准差) 2. 回归系数的区间估计和假设检验 统计性质: 和Q相互独立 ?1的置信区间 对?1的假设检验 t 分布 问: 怎样缩短?1的置信区间? 拒绝H0 回归模型有效 ?1的置信区间不包含零点 一元线性回归的统计分析 3.模型的有效性检验 总偏差平方和 回归平方和 残差平方和 偏差的分解: S U Q = + 决定系数 因变量的总变化中自变量引起的部分的比例 F F(1,n-2), 1-? 若H0成立 给定? ,有F(1,n-2), 1-? 一元线性回归的统计分析 拒绝H0 回归模型有效 利用一元线性回归模型进行预测 x0给定, y0的预测值: 性质: 无偏, 且 最小 预测区间 n很大且 x0接近 0 x y s~剩余标准差 一元线性回归的MATLAB实现 b=regress(y,X) [b,bint,r,rint,s]=regress(y,X,alpha) 输入:y~因变量(列向量),X~1与自变量组成的矩阵,alpha~显著性水平?(缺省时设定为0.05)。 输出: ,bint~?0, ?1的置信区间,r~残差(列向量),rint~残差的置信区间, s(4个统计量): 决定系数R2; F值; F(1,n-2)分布大于F值的概率p; 剩余方差s2。 (当p? 时拒绝H0,回归模型有效) 注意 regress 与 polyfit 用法的区别 例1 血压与年龄 模型 xueya1.m R2=0.4540 F=23.2834 p0.0001 s2 = 273.7137 [0.5601 1.3864 ] 0.9732 ?1 [78.7484 118.0683] 98.4084 ?0 回归系数置信区间 回
您可能关注的文档
- 含交叉裂隙节理岩体锚固效应及破坏模式-岩石力学与工程学报.pdf
- 含大规模电力电子装备的电力系统故障分析与保护综述-电力系统自动化.pdf
- 含柯石英榴辉岩形成深度的构造校正测算-地质力学学报.pdf
- 含瓦斯水合物煤体强度特性三轴试验研究-煤炭学报.pdf
- 含能材料量子化学计算方法综述.pdf
- 含裂缝地层的过套管电阻率测井响应特征研究-地球物理学报.pdf
- 听知觉处理障碍Central Auditory Processing Disorders (CAPD;APD).ppt
- 启生中医诊所工作规则-明德中医诊所.doc
- 吸力式沉箱组合基础承载特性研究-水利水运工程学报.pdf
- 吸尘器的结构和原理吸尘器的原理简述.pdf
文档评论(0)