[统计数据的应用.ppt

  1. 1、本文档共78页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[统计数据的应用

黑人总统,美国有种族歧视吗? 统计学案例 美国佛罗里达州的凶杀案 (摘自:茆诗松等 高等数理统计) 事实果真如此? 似乎白人被判死刑的可能性等于黑人被判死刑的可能性(事实上,表中白人凶手被判死刑的比例略高) 换言之,肤色与死刑关联性不大 进一步推论,从这点上,恐怕找不到种族(肤色)歧视的有利证据 显然与当时的美国现实不相符合 数据表明:种族和肤色歧视在七十年代确实存在 启示 用数据说话,更能证明你的观点 不要被数据假象所迷惑 深入挖掘数据背后的事实(增加一个因素,结论不同) 对统计 的认识 基本概念------概率 概率是频率的稳定值。概率非负,介于0与一之间的一个数值,某一事件所有可能结果的概率总和为1。 例如某种新产品畅销的可能性为80%,可以理解成其主观概率为0.8. 例一:某公司声称所产一种感冒新药治愈率为95%,现在十个患者服用,问至少八个病愈的可能性有多大? 答案是98.85% 基本概念------概率 直觉并不可靠。“生日问题” 某班级中有五十个学生,问至少有两个人在同一天的概率有多大? 答案是97%。 概念 数学期望(均值) 分赌本问题17世纪中叶,一位赌徒向法国数学家帕斯卡提出了一个令他苦恼已久的问题: 甲乙两人赌技相同,各出赌注50法郎,每局无平局 规则:谁先赢三局,则得全部赌本100法郎 意外:当甲赢2局,乙赢一局,因故中断赌博。 问题:如何分配这100元? 共识:平均分对甲不公平, 全部归甲对乙不公平。 按比例分 方案一:甲得100法郎中的2/3,乙得100法郎中的1/3.这是基于已赌局数。 方案二:1654年帕斯卡提出:设想再赌下去,再赌两局必可结束。 后两局的结果可能是: 甲甲、甲乙、乙甲、乙乙。 其中“甲乙”代表甲赢第一局,乙赢第二局。以此类推。 分析 四种情况中三种情况甲可以获100法郎,只有一种情况下甲获0法郎。 甲的期望所得:0X0.25+100X0.75=75(法郎) 这种分法不仅考虑已赌局数,而且包括对再赌下去的一种“期望”。更为合理 称为“均值”更形象易懂 基本概念 方差与均方差 有两个牌子的手表,各抽100只,检测走时误差.结果发现其误差均值为0 为了比较两个牌子手表的走时好坏,计算方差与标准差。显然A手表走时偏差更好 德国十马克上的高斯 标准正态分布 不同的μ、σ对应的正态曲线 6σ与正态分布 3σ流程与6σ流程的比较 什么是统计? 统计的多重含义:统计工作,统计资料, 统计学 统计的起源 传统的统计学主要指官方统计、工业统计和现场统计,现代统计学则注重挖掘数据包含的信息,用已知来预测未知,用过去预测未来。 国际数理统计学会主席范剑青说:“社会活动看似杂乱无章,对个体来说有很多不确定性,但总体上都是服从一些统计规律的。无论医学、经济学、社会科学、工业生产或是科学实验得到的都是数据,统计学就是对这些数据进行加工和提炼,找出规律、预测未知。概率统计是描述社会活动最简洁有力的语言。” 1.描述统计: 主要是指在获得数据之后,通过分组、有关图表、统计指标等对现象加以描述; 2.推断统计: 指通过抽样调查等非全面调查,在获得样本数据的基础上,以概率论和数理统计为依据,对总体的情况进行科学推断; 通过建立回归模型对现象的依存关系进行模拟、对未来情况进行预测。 数据的分类 1、计量数据 如人的身高、体重……,产品长度,直径,重量……,股票的价格、市盈率……。它们的取值可以是某个区间内的任意一个实数。 2、计数数据 如企业职工人数、成交股票股数等。它们在整数范围内取值,大部分还仅在非负整数范围内取值。 3、名义数据 有的时候,观察值不是数,而是事物的属性,如人的性别(男、女),物体的颜色、形状。我们常用数来表示属性的分类,如用数“1”和“2”分别表示男和女。这些数只起一个名义的作用,只是一个代码,没有大小关系,也不能进行运算。这里“2”与“1”不能比较大小也,“1+2”也没有意义。这类数据称为名义定性数据,简称名义数据。 4、有序数据 有些事物的属性有顺序关系,如人的文化程度由低到高可分为文盲、小学、初中、高中或中专和大专或大学等5类,可用数0、1、2、3、4、5分别表示。又如顾客对某商场营业员服务态度的评价分为“满意”、“一般”、“不满意”三类,可分别用“3”、“2”、“1”表示。这些数据只是起一个顺序作用,类与类之间的差别是不能运算的。例如“满意”比“一般”好,但“好多少”是不能计算的,这里的“3-2”是没有意义的。这一类数据称为有序定性数据,简称有序数据。 1982年,新中国第一批18个博士毕业,其中数理统计方向占两位(赵林城 白志东)导师是陈希儒教授 1986年,

文档评论(0)

wu12youli + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档