统计学口原理.docVIP

下载本文档

61
0
约2.66万字
约 31页
2017-01-23 发布于北京
举报
版权申诉

统计学口原理.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

统计学原理第一章基础第一节统计的定义统计是从数据中获取信息的一种方法。第二节主要统计概念一、总体总体就是统计工作者研究对象的全体。对总体的描述性测度称为参数，如均值，最大值、最小值等。二、样本样本就是从总体中抽取的若干数据的集合。对样本的描述性测度量是统计量。三、统计推断统计推断是运用样本数据对总体进行估计、预测和决策的过程。可靠性测度共有两种：置信水平和显著性水平。三个例子：企业多元化战略：多元化企业和非多元化企业的绩效差异。普通学生和学生干部：就业和收入差异。男生和女生：成绩差异。第三节：数据的类型一、定距数据定距数据是实数：如身高、距离、收入等二、定性数据定性数据的取值是类别：如男性、女性。三、定序数据定序数据也表现为定性的，但是取值是有顺序的。例如，不好、一般、好、很好、优秀。定性数据和定序数据的区别在于后者的取值是有顺序的。第四节数据的描述方法一、图表描述方法计算机命令将数据输入或导入列中。选择数据列。单击图表向导（Chart Wizard）、线图（Line）和完成（Finish）。如果想做某些改变，则鼠标右键单击图表，选择图表选项。二、数字描述方法 1.中心位置的测度（1）算术平均数求和：SUM 平均值：average （2）中位数：中位数是通过把观测值按顺序排列而计算得到的。处于中间位置的观测值即为中位数。中值：median，如果数据有n个，若n为单数，取值为中间的数值；若n为偶数，取值为中间两个数的均值。（3）众数：众数是出现频率最高的一个或者几个观测值。众数：mode。注意：在不只有一个众数的情况下，Exce只显示最小的，不显示是否有其它众数。最大值：max；最小值：min；平方根：sqrt 数据分析：分析工具库是Excel所附的一组统计函数，它可以通过菜单栏找到。单击工具，找到“数据分析”；如果“数据分析”不存在，点击“加载宏”，然后选择分析工具库。找一台安装有数据分析的电脑,进入excel安装目录(一般是C:\Program Files\Microsoft Office)进入OFFICE1文件夹拷贝Library文件夹到你的电脑同名文件夹里,然后执行前面的加载宏步骤就可以了表示第i期的回报率。则几何平均数为当我们需要知道一个时间变量的平均增长率或者平均变化率的时候，我们使用几何平均数。然而需要强调的是，如果你打算估计将来任何特定时期的回报率（或增长率）的均值，正确的做法还是计算n个回报率的算术平均数。 2.变异性的测度（1）极差：极差=最大的观测值-最小的观测值（2）方差：方差：var （3）标准差：标准差：stdev （4）变异系数：观测值的标准差除以均值第二章数据的收集与抽样第一节数据来源宏观数据：全国及各省份统计年鉴、金融统计年鉴、人口统计年鉴、《新中国60年统计资料汇编》微观数据：统计调查、上市公司年报（巨潮资讯网）、上海（深圳）证券交易所、中国证监会（银监会、保监会）等政府机构网站。第二节抽样方案一、简单随机抽样在抽样过程中，任何拥有相同数量观测值的样本被抽中的概率都相同。二、分层随机抽样分层随机抽样是通过将总体划分为互斥的子集或层，并在每个层中抽取简单随机样本得到的。例如： 1.性别：男、女 2.年龄：20岁以下、20-30、31-40、41-50、51-60、60岁以上 3.职业 4.家庭年收入三、整群抽样整群抽样是总体元素的群或族的简单随机样本。当编制完整的总体成员名单存在困难或者成本过高时，或者总体元素在地理位置上广泛分布时，整群抽样技术是非常有用的。例如，假设我们想对一个大城市中家庭平均年收入进行估计。如果使用简单随机抽样方案，需要列出该城市所有家庭的名单再从中抽样；使用分层随机抽样方案，既需要列出家庭名单，还有根据其它变量对家庭进行分类以便生成层。一种相对节约成本的可选方法是将该城市的每一个街区作为一群，随机抽取群来构成样本，对这些样本群中每个家庭的收入进行调查。这样可以降低成本。但是，由于同一群中的家庭在许多方面都是类似的，因而整群抽样也就使抽样误差有所增加。将节约的成本用于增大样本规模，可以在一定程度上弥补这个缺陷。第三节抽样与非抽样误差一、抽样误差抽样误差是指样本和总体之间的差异，这个差异是由恰好被选入样本的观测值引起的。二、非抽样误差非抽样误差比抽样误差更严重，因为即使抽取更大的样本也不能减小误差的值或者发生概率。即便是普查也可能会包含非抽样误差。非抽样误差的原因： 1.数据获取过程中的误差。这类误差包括计算机录入时所犯的错误，对问题解释不当而导致的数据错误记录，也可能是对一些敏感性问题的不准确回答。 2.无