- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第01,2章概論
应用统计分析
概 论
1.定义:
统计学(Statistics):是一门关于数据资料的收集,整理,分析,推断的科学。
2.分类 :
西方的分类 东方的分类 统计学 (收集、整理) 记述统计学
(descriptive statistics) 社会统计学
(social statistics) (分析、推断) 推断统计学
(inferential statistics) 数理统计学
(mathematical statistics)
这是一门学科的两个部分。前者以收集,整理,描述为主。通过数据展示事物的某种特征。我国多在社会科学中介绍。后者以分析、推断为主。以局部推断全体,由现在推断将来。我国多在自然科学中介绍。东、西方分类略有不同。近年有趋同趋势。
3 发展史:
统计以收集资料为特征,这在我国4000多年以前就开始了。据《后汉书·群国一》记载,禹治水后全国人口为1355(万)3923人。在古罗马,古希腊也有类似记载。在我国,“统计”作为一个专用名词,出现于晚清。
但统计作为一门科学真正发展起来,即统计学,却只有200多年的历史。标志是概率论的引入,从而使统计学成为一门科学。1713年,瑞典人Bernoulli的《推测术》的出版。标志着从理论上研究概率的开始。
概率论与统计的结合始于法国的拉普拉斯(Laplace)和德国的高斯(Gauss)。1786年拉普拉斯发表文章以大数定律为基础,尝试大样本推断,估计法国全国人口。1830年德国的C. F. Gauss通过对测量误差的研究,发现了正态分布为误差理论奠定了基础。
1880年英国生物学家F. Galton发现了“子女趋中律”,为回归分析之始。“回归”一词就是他定名的。
进入20世纪后,英遗传学家K. Pearson提出假设检验理论。统计学家R. A. Fisher等人先后在小样本理论、区间估计、方差分析等方面作了大量工作。Neyman提出了抽样理论。统计学真正完备起来只是近几十年的事。
4.应用:
因统计学的研究方法是依据外部观察到的事实、数据进行分析从而研究事物内部的规律性。所以统计学知识已被应用到几乎所有的科学中去,如医学、生物学、社会学、天文学、经济学和自动控制过程等。
例1.新华社1989年2月19日报道“我国1988年新增人口1541万”。自然增长率超过14‰,1988年并未做人口普查。这个数字是怎样得到的呢?这里用到了统计中的抽样和估计理论。这是在人口学,社会学中的应用。
例2.审计部门要对某个企业或事业单位的财务进行审查。实际中不可能对每一笔账目都进行审查,只能采取统计抽样的方式。
例3.股市的综合指数收盘价是通过对每一支股票每天最后1分钟的综合统计结果。
例4.《今晚报》昨日(2000.9.17)报道,天津4校(南开大学、天津大学、天津医科大学和河北工业大学)统计调查显示,大学生的平均月消费为340元(一次性学费和住宿费除外)。其中40%的学生平均月消费低于300元。
例5.作为一个有趣例子,统计学近年也被应用于语言学,从而产生了一门“数理语言学”。有人应用于“红楼梦”研究,为后40回非曹雪芹所写提供了又一有力证据。首先对全书作了统计,共有72万9604个字。把字按出现的次数做了频数分析。发现频数最高的字,不是“宝”也不是“玉”,而是“了”,“的”,“不”等虚字。虚字频率最高是写作文章的普遍规律,但由于作者不同,文笔不同,虚字分布规律也不同。把全书分为三组,前80回分为两组,后40回一组。发现前两组虚字分布规律相同,后一组虚字分布与前两组差异很大。经分布律检验,证明后40回非曹氏所作。
可以这样说,只要关系到数据处理,必然要用到统计学知识。随着电子计算机的发展,使统计学的应用更加广阔。
统计资料(Data)的收集
1.1 定义
统计资料:作某种研究所需事实和数字,它是进行统计分析的原材料。
例1.研究运动员身体状况,则体检表就是统计资料 。(p.1)
姓名 年龄 性别 身高 血压 甲 29 男 185 120—80 乙 26 女 165 118—75 丙 36 男 174 138—90 丁 21 女 160 120—70
可见统计资料一般由元素、变量、观测三部分组成。
元素(element):研究对象。
变量(Variable):一种属性或特征,如姓名、年龄等。
观测(Observation):某变量的具体取值。
变量分定性,定量两种。如性别变量是定性的,而年龄变量是定量的。但定性与定量变量的区别不是绝对的,可以互相转化。如把“身高”变量划分为“高身材”“中等身材”“矮身材”,于是转化成为定性变量。若把男取1,女取0,则“性别”变量变成了定量变量。
1.2 统计资料的收集
统计资料的收集
您可能关注的文档
最近下载
- 高边坡专项施工方案(专家论证版).pdf VIP
- 《工程化学基础》教案-第3章-2011.ppt VIP
- 抗日英雄王二小.pptx VIP
- 第5课 用发展的观点看问题-【中职专用】2024年中职思想政治《哲学与人生》金牌课件(高教版2023·基础模块).pptx VIP
- 老友记台词剧本第一季第1集中英双语左右对照.pdf VIP
- 形势与政策社会实践报告模板.docx VIP
- 全套SPC表格(很全面) CPK.xls VIP
- T_CI 540-2024 红枣蒸馏酒生产技术规程.pdf
- 施工组织设计方案(高速公路通信迁改).docx VIP
- Part3-4 Unit6 Craftsmanship课件高一英语(高教版基础模块2).pptx
文档评论(0)