统计学思考题答案.doc

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学思考题答案

统计学思考题 一、名词解释 1.参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。所关心的参数主要有总体均值、标准差、总体比例等。总体参数通常用希腊字母表示 2.残差: 因变量的观测值与根据估计的回归方程求出的预测值之差,用e表示。 反映了用估计的回归方程去预测而引起的误差,可用于确定有关误差项ε的假定是否成立 3.标准分数:变量值与其平均数离差除以标准差后的值就是标准分数也称标准化值或z分数。P87 4.次序统计量:一组样本观测值X1,X2,…,Xn由小到大的排序X(1)≤X(2)≤…≤ X(i)≤…≤ X(n)后,称X(1),X(2),…,X(n)为次序统计量 。中位数、分位数、四分位数等都是次序统计量 5.β错误:原假设为伪是没有拒绝,犯这种错误的概率用表示,所以也称β错误或取伪错误 6.错误:原假设为真时拒绝原假设,犯这种错误的概率用α表示,所以也被称为错误或弃真错误。 7.多元回归方程:描述因变量 y 的平均值或期望值如何依赖于自变量 x1, x2 ,…,xk的方程。多元线性回归方程的形式为 E( y ) = (0+ (1 x1 + (2 x2 +…+ (k xk 8.多元回归模型:描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xk 和误差项( 的方程,称为多元回归模型。 其一般形式为 : E( y ) = (0+ (1 x1 + (2 x2 +…+ (k xk + ε 9.多重判定系数:是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例。 10.F分布:设随机变量Y与Z相互独立,且Y与Z分别服从于自由度为m和n的 分布,随机变量X有如下表达式:F=nY/mZ,则称X服从于第一自由度为m,第二自由度为n的F分布,记作X~F(m,n) 11.方差分析:检验各个总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。 12.分布:设随机变量X1,X2,…,Xn相互独立,且Xi(i=1,2,…,n)服从标准正态分布N(0,1)则他们的平方和 服从自由度为n的分布。期望为:E((2)=n,方差为:D((2)=2n(n为自由度) 13.非平稳序列:是有趋势、季节性和周期性的序列,他可能只含有一种成分也可能含有几种成分的组合。 14.偏态:由统计学家皮尔逊提出,它是对数据分布对称性的测度。测度偏态的统计量是偏态系数,记作SK。偏态系数=0为对称分布,偏态系数 0为右偏分布,偏态系数 0为左偏分布 15.峰态:由统计学家皮尔逊提出,它是对数据尖峰或平峰程度的测度即数据分布扁平程度的测度。测度峰态的统计量是峰态系数,记作K。 16.截面数据: 在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况。比如,2005年我国各地区的国内生产总值数据 17.离散系数:标准差与其相应的均值之比,对数据相对离散程度的测度,消除了数据水平高低和计量单位的影响。用于对不同组别数据离散程度的比较。 计算公式为 18.列联系数:又称列联相关系数,简称C系数,主要用于大于2×2列联表的情况。 19.判定系数:回归平方和占总误差平方和的比例,记作R2. 反映回归直线对观测数据的拟合程度,取值范围在 [ 0 , 1 ] 之间 20.平均增长率:也称平均增长速度,它是序列中各逐期环比值(也称环比发展速度) 的几何平均数减1后的结果。 21.平稳序列: 基本上不存在趋势的序列.各观察值基本上在某个固定的水平上波动,虽有波动,但并不存在某种规律,而其波动可以看成是随机的 22.趋势:是时间序列在长时间内呈现出来的某种持续向上或持续下降的变动,也称长期趋势。时间序列中的趋势可以是线性的也可以是非线性的。 23.四分位差:反映了中间50%数据的离散程度,也称为内距或四分间距。是对顺序数据离散程度的测度,不受极端值的影响。用于衡量中位数的代表性 上四分位数与下四分位数之差:Qd = QU – QL 24.t分布:高塞特以“Student”(学生)为笔名的论文中首次提出。t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。P140 25.显著性水平:是一个统计专用名词。在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率。它是由人们根据检验的要求确定的,用α表示。 26.相关系数:测度2(2列联表中数据相关程度。对于2(2 列联表,( 系数的值在0~1之间。列联表中变量的位置可以互换,( 的符号没有实际意义,故取绝对值即可 27.异众比率:是对分类数据离散程度的测度,是指非众数组的频数占总频数的比例。 用于衡量众数的代表性 28.中位数:排序后

文档评论(0)

wuyuetian + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档