统计学口原理.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学原理 第一章 基础 第一节 统计的定义 统计是从数据中获取信息的一种方法。 第二节 主要统计概念 一、总体 总体就是统计工作者研究对象的全体。 对总体的描述性测度称为参数,如均值,最大值、最小值等。 二、样本 样本就是从总体中抽取的若干数据的集合。 对样本的描述性测度量是统计量。 三、统计推断 统计推断是运用样本数据对总体进行估计、预测和决策的过程。 可靠性测度共有两种:置信水平和显著性水平。 三个例子: 企业多元化战略:多元化企业和非多元化企业的绩效差异。 普通学生和学生干部:就业和收入差异。 男生和女生:成绩差异。 第三节: 数据的类型 一、定距数据 定距数据是实数:如身高、距离、收入等 二、定性数据 定性数据的取值是类别:如男性、女性。 三、定序数据 定序数据也表现为定性的,但是取值是有顺序的。例如,不好、一般、好、很好、优秀。 定性数据和定序数据的区别在于后者的取值是有顺序的。 第四节 数据的描述方法 一、图表描述方法 计算机命令 将数据输入或导入列中。 选择数据列。 单击图表向导(Chart Wizard)、线图(Line)和完成(Finish)。 如果想做某些改变,则鼠标右键单击图表,选择图表选项。 二、数字描述方法 1.中心位置的测度 (1)算术平均数 求和:SUM 平均值:average (2)中位数:中位数是通过把观测值按顺序排列而计算得到的。处于中间位置的观测值即为中位数。 中值:median,如果数据有n个,若n为单数,取值为中间的数值;若n为偶数,取值为中间两个数的均值。 (3)众数:众数是出现频率最高的一个或者几个观测值。 众数:mode。注意:在不只有一个众数的情况下,Exce只显示最小的,不显示是否有其它众数。 最大值:max;最小值:min;平方根:sqrt 数据分析:分析工具库是Excel所附的一组统计函数,它可以通过菜单栏找到。单击工具,找到“数据分析”;如果“数据分析”不存在,点击“加载宏”,然后选择分析工具库。找一台安装有数据分析的电脑,进入excel安装目录(一般是C:\Program Files\Microsoft Office)进入OFFICE1文件夹拷贝Library文件夹到你的电脑同名文件夹里,然后执行前面的加载宏步骤就可以了表示第i期的回报率。则几何平均数为 当我们需要知道一个时间变量的平均增长率或者平均变化率的时候,我们使用几何平均数。然而需要强调的是,如果你打算估计将来任何特定时期的回报率(或增长率)的均值,正确的做法还是计算n个回报率的算术平均数。 2.变异性的测度 (1)极差:极差=最大的观测值-最小的观测值 (2)方差:方差:var (3)标准差:标准差:stdev (4)变异系数:观测值的标准差除以均值 第二章 数据的收集与抽样 第一节 数据来源 宏观数据:全国及各省份统计年鉴、金融统计年鉴、人口统计年鉴、《新中国60年统计资料汇编》 微观数据:统计调查、上市公司年报(巨潮资讯网)、上海(深圳)证券交易所、中国证监会(银监会、保监会)等政府机构网站。 第二节 抽样方案 一、简单随机抽样 在抽样过程中,任何拥有相同数量观测值的样本被抽中的概率都相同。 二、分层随机抽样 分层随机抽样是通过将总体划分为互斥的子集或层,并在每个层中抽取简单随机样本得到的。例如: 1.性别:男、女 2.年龄:20岁以下、20-30、31-40、41-50、51-60、60岁以上 3.职业 4.家庭年收入 三、整群抽样 整群抽样是总体元素的群或族的简单随机样本。 当编制完整的总体成员名单存在困难或者成本过高时,或者总体元素在地理位置上广泛分布时,整群抽样技术是非常有用的。 例如,假设我们想对一个大城市中家庭平均年收入进行估计。如果使用简单随机抽样方案,需要列出该城市所有家庭的名单再从中抽样;使用分层随机抽样方案,既需要列出家庭名单,还有根据其它变量对家庭进行分类以便生成层。一种相对节约成本的可选方法是将该城市的每一个街区作为一群,随机抽取群来构成样本,对这些样本群中每个家庭的收入进行调查。这样可以降低成本。 但是,由于同一群中的家庭在许多方面都是类似的,因而整群抽样也就使抽样误差有所增加。将节约的成本用于增大样本规模,可以在一定程度上弥补这个缺陷。 第三节 抽样与非抽样误差 一、抽样误差 抽样误差是指样本和总体之间的差异,这个差异是由恰好被选入样本的观测值引起的。 二、非抽样误差 非抽样误差比抽样误差更严重,因为即使抽取更大的样本也不能减小误差的值或者发生概率。即便是普查也可能会包含非抽样误差。 非抽样误差的原因: 1.数据获取过程中的误差。这类误差包括计算机录入时所犯的错误,对问题解释不当而导致的数据错误记录,也可能是对一些敏感性问题的不准确回答。 2.无

文档评论(0)

xiaofei2001128 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档