- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
课程提纲(Syllabus) 教师 张青 联系方式:zhangq @ bjfu.edu.cn 办公地点:理学院楼二层东侧 203 参考书 1 多元统计分析 于秀林 任雪松 编 中国统计出版社 1999 2 应用多元统计分析 高惠璇 编 北京大学出版社 2005 3 多元统计分析选讲 张饶庭 著 中国统计出版社 2002 4 多元数据分析 James M Lattin (Stanford Uni.) 机械工业 2003 5 应用多元统计方法 Johnson (Kansas State Uni.) 高教 2005 成绩评定 作业: 50% 考试: 50% 教学内容:见教材 生命科学 社会科学 统计分析方法 现象 多样性 重复性 复杂性 随机性 多元统计分析方法 多元回归分析方法 多元判别分析方法 聚类分析方法 …… 目的 从看起来 杂乱无章 的数据中 发现提炼 规律性的结论 为什么要多元分析 必备的知识 良好的 专业训练 必要的 统计分析工具 传统的方法回答的两个问题 数据为什么不一样: 系统因素与随机因素 变量之间的关系 回归(定量),方差 类别(定性数据的类别差异) 衡量的方法 : 统计方法的基本概念 随机变量 X (random variable) 在自然界中,有些变量在每次观察前,不可能事先确定其取值;经过大量反复观察,其取值又有一定的规律,这种变量称为随机变量X。 例 (1). 掷骰子出现某点数的概率为1/6,若掷100次,则出现该点数的次数X是随机变量; (2). 332路公车每10分钟发一趟车,某人在随机的时间到达车站等车,则等车时间X是随机变量。 1. 随机变量、概率分布 离散型随机变量 X的所有可能取值是有限个或可列个。 连续型随机变量 最常见的一类非离散型随机变量。 对连续型随机变量,考察事件{aXb}的概率。若存在非负的可积函数p(x),使得:对任意的a, b(ab),都有 则称p(x)为随机变量X的概率密度函数。 概率密度函数 (PDF, probability density function) 对所有随机变量X,可以定义以下的概率分布函数F(x): P(x)的性质: 2. 随机变量的数字特征 均值(mean) 或数学期望(mathematical expectation) 离散型随机变量的均值 设离散型随机变量X的分布律为: 若 收敛,则称E(X)为随机变量X的均值或数学期望。 xi:质点i的坐标;pi: 质点i的质量 ???E(X): 质心坐标 连续型随机变量的均值 设X为连续型随机变量,它的概率密度函数为p(x) ,若 收敛,则称E(X)为随机变量X的均值或数学期望。 小结: E(X)反映随机变量X的统计平均性质,代表随机变量取值的一般水平或集中的位置,略去了随机变量概率分布规律的具体细节。 方差(variance) 设随机变量X的均值为E(X),则: 对于离散型随机变量X,其方差为: 对于连续型随机变量X,其方差为: 计算D(X)的简单公式: 小结: D(X)反映随机变量X的相对于均值E(X)的偏离程度,代表随机变量取值的分散性,也是统计平均的性质。 正态分布(Normal distribution) 设随机变量X的概率密度为: 其中-??+ ?,?0均为常数。称X服从参数为?,?的正态分布,记作X~N(?,?2). ?:均值; ?:方差 ?=0; ?2=1时,称为标准正态分布,记为X~N(0,1)。 遵从正态分布的随机变量X,其正态分布函数为: 正态分布的若干性质 正态分布完全由其均值?和方差?2决定; 正态分布的概率密度函数曲线呈对称的“钟形”; 经验规则(3 ?准则): 68% 95% 99% ?+? ?+2? ?+3? ?-? ?-2? ?-3? ? p(x) x 3. 总体和样本 总体X (population) 研究对象的某种特征值的全体组成的集合。用X表示。 样本X1, X2, …, Xn (sample) 在总体中选取部分有代表性的子集称为(随机)样本。 一个样本是来自总体X的一组相互独立同X分布的随机变量。 样本值x1, x2, …, xn 从总体X随机抽取的一组观测值,常用x1, x2, …, xn来表示样本或样本值。 4. 统计量及其参数估
原创力文档


文档评论(0)