姜永帅-高等多元统计分析第一节-绪论.pptVIP

姜永帅-高等多元统计分析第一节-绪论.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息科学与技术学院 高等多元统计分析 参考教材: 《多元统计分析》于秀林 任雪松 中国统计出版社 第一章 绪论 一、什么是多元统计分析 1、什么是多元统计分析 多元统计分析是研究多个随机变量之间相互依赖关系以及内在规律性的一门科学 1、数据简化和结构简化 在不损失信息的情况下,如何简单的描述被研究对象,如主成分分析、因子分析等 2、分类与分组 将具有某些相同属性的特征或样本分组。如基因芯片聚类分析等 3、变量间的依赖性研究 研究变量之间的相互关系,如共表达等 4、预测 根据已知一些变量的观测值,对另一些变量的值进行预测。如根据已知marker预测疾病状态。 5、假设检验与验证 对些设想进行统计推断。 问题: 当你进行一项社会数据调查或者实验数据记录时,你通常会怎么去做呢?用什么工具或软件,以什么格式存放数据呢? 例如: (1)测量全班同学的身高 (2)测量全班同学的身高、体重和年龄 三、多元统计分析中数据的组织方式 实例:下图为一套基因表达谱数据,来自于GEO 四、一元统计分析基础知识回顾 数据是统计分析的生命。 1、数据类型:离散型 和 连续型 2、数据分布类型:离散型 和 连续型 3、研究对象:随机变量 X (注:多元统计中研究对象为随机向量) 4、分布:频率 和 概率密度 5 累计分布: 常见概率密度函数: 6、参数估计 为什么要进行参数估计: (1)从理想到现实 (2)用少数的几个参数控制一整批数据 参数估计分为:点估计和区间估计 7、参数估计好坏的评判标准 (1)一致估计(样本量无限大时候的性质) (2)无偏估计: 注:无偏估计就是系统误差为零的估计。 8、几个重要的参数估计 实战: 9、假设检验 基础:小概率事件是非随机发生的。 其基本思想和步骤均可归纳为: 第一,提出待检验的假设H0和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 例如均值的检验和方差的检验、如何变得杰出等等。 10.比较参数检验和参数检验 * * 哈尔滨医科大学 主讲教师:姜永帅 分子生物学馆 130办公室 —统计遗传学教研室 1 什么是多元统计分析 2 3 4 6 多元统计分析在生物信息学中的作用 多元统计分析中数据的组织方式 一元统计学分析基础知识回顾 ※ △ 例如: 一、什么是多元统计分析 一、什么是多元统计分析 二、多元统计分析在生物信息学中的作用 多元统计分析在生物信息学的研究中使用非常广泛,是生物信息学研究的必备工具。 二、多元统计分析在生物信息学中的作用 数据分析在各个领域、各个行业都起着重要的作用(例如红楼梦作者验证)。 三、多元统计分析中数据的组织方式 (1) (2) 三、多元统计分析中数据的组织方式 三、多元统计分析中数据的组织方式 三、多元统计分析中数据的组织方式 样本(个体) 基因(特征) 样本(个体) 特征 三、多元统计分析中数据的组织方式 样本(个体) 特征 其中,n个样本,每个样本有p个特征 即:P维向量 三、多元统计分析中数据的组织方式 注:当p=1的时候,为X一元随机变量,多元随机变量为一元随机变量的扩展。 四、一元统计分析基础知识回顾 离散型: 连续型: sum 切线斜率变化 曲线下面积 (从左侧累计) 四、一元统计分析基础知识回顾 四、一元统计分析基础知识回顾 四、一元统计分析基础知识回顾 四、一元统计分析基础知识回顾 一些重要的软件SAS,Matlab,R均使用无偏估计 四、一元统计分析基础知识回顾 四、一元统计分析基础知识回顾 四、一元统计分析基础知识回顾 * * *

文档评论(0)

1243595614 + 关注
实名认证
文档贡献者

文档有任何问题,请私信留言,会第一时间解决。

版权声明书
用户编号:7043023136000000

1亿VIP精品文档

相关文档