- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
72多元统计分析.ppt
第三章 多元统计分析 在工业、农业、医学、气象、环境以及经济、管理等诸多领域中,常常需要同时观测多个指标。例如,要了解一个国家经济发展的类型也需观测很多指标,如:人均国民收入、人均工农业产值、人均消费水平等等。 在医学诊断中,要判断某人是有病还是无病、也需要做多项指标的体检,如:血压、心脏脉博跳动的次数、白血球、体温等等。 总之,在科研、生产和日常生活中,受多种指标共同作用和影响的现象是大量存在的,举不胜举。上述指标, 在数学上通常称为变量,由于每次观测的指标值是不能预先确定的。因此每个指标可用随机变量来表示。 多元分析也是一种处理大量数据的方法,与统计分析所不同的是:多元分析所处理的不是统计意义下的样本,一般并不要求用它们去推断总体的特征,因而不需要随机取样,不必了解数据的分布性质,也不涉及显著性检验。 从应用的角度看,多元统计分析就是要研究多个变量之间的关系,但哪些问题才是多元统计的内容,并无严格的界限。 一般认为,典型的多元统计分析主要可归结为两类问题:第一类是决定某一样品的归属问题,即称之为分类,判别分析和聚类分析就属于此内容。第二类问题是设法降低变量维数,同时将变量变为独立变量,以便更好地说明多变量之间的关系,常称之为排序。主成分分析和因子分析属于此内容。 多元统计分析有很多的方法,我们只介绍几种在生物学中较常用的方法。 第一节 数据的类型 可以把研究的对象叫做实体,描述实体数量特征的各个信息项目称为属性(变量)。如在植物生态学研究中,实体可以是样方、标地、地段(林分)或群落等等。实体中观测的各个种的数据项目(如种的存在不存在、种的频度、盖度或重量等等),以及环境因素的数据项目(如样地坡度、雨量、日照、土壤深度、各种养分元素的含量等等)都是属性。 由于属性多种多样,反映它们的数据类型就有所不同。比如,种的频度、雨量、日照时数等是数值;种的存在和不存在只有两种状态:土壤颜色可分为红、黑、黄等多种状态等等。所以需要考虑数据的类型,以及不同类型间的转化,最后将具有同一类型的数据排列成要求的格式。 具体来讲,属性的类型分为三种: 一、名称属性(nominal attributes) 有的属性只能描述为若干种不同的状态,每个实体具有其中一种状态。 比如土壤的颜色(属性)可分为红、黑、黄等等:岩石可分为页岩、砂岩、玄武岩、花岗岩等等;植被可分为森林、草原、灌丛、苔原等等。这种属性的基本特点是,在作为数据处理时各个状态的地位是等同的,状态之间没有一定的顺序。由于它的各种状态可用不同名称表示,所以称这种属性为名称属性。 1.二元属性 名称属性的一种重要特别情况,是只具有两个状态。如物种的存在不存在,某昆虫的有翼无翼,某植物的有刺无刺,动物是雌是雄,等等。这种属性叫做二元属性,因为它往往是确定某种性质的有无,所以也称为定性属性。 对二元属性的两个状态常用两个数字0和1来表示。当属性是指某种性质的有无时,一般用0表示不具有该性质,1表示具有该性质,比如用0表示种不存在,1表示存在。当属性是指两个对立的状态时,0和l各表哪个状态可以随便指定,比如可用0表雄、1表雌,或者反之。 2.无序多状态属性 具有三个以上状态的名称属性,又称为无序多状态属性,以强调它的状态间无一定顺序。 假设某属性有n个状态,我们可分别用数字1、2、3、……、n代表各个状态。比如岩石类型,可用1代表页岩,2代表砂岩,3代表玄武岩,4代表花岗岩。 二、 顺序属性(ordinal attributes) 它与无序多状态属性一样,也只能分成多个状态。所不同的是,现在的状态有确定的顺序,所以也称为有序多状态属性。 例如某植物种的多度分为大量、常见、普遍、罕见和不出现五种状态;土壤酸碱度分为强酸性、弱酸性、中性、弱碱性、强碱性等状态;植物种子分成大、中、小三级,等等。显然各状态之间的顺序是有意义。 与无序多状态属性—样,对顺序属性也没有理想的数据表示方法。用1、2、3、…、n依次表示各个状态,虽然数字间的大小差别反映了属性状态间的顺序关系,但是不能恰当地表示各状态间的差距。 三、 数量属性(quantitative attributes) 有许多属性是用数值数据来表示的,比如某植物种的频度、盖度和重量,土壤的深度、含水量,各养分元素的含量等等都是这种属性,我们称之为数量属性,或定量属性。描述这种属性的数值可以直接用于通常数学上的各种运算和大多数的相似系数计算。 第二节 数据的处理 一、数据的简缩 去除极大或极小的数据 二、数据的转换 将原始数据通过运算转化为新值,
您可能关注的文档
最近下载
- 梁氏族谱之祖系.doc VIP
- 工程维修委托协议合同书.docx VIP
- 《RPA财务机器人实训教程》教案示例.docx VIP
- 2023年3月scratch图形化编程等级考试试卷(四级)不带答案.docx VIP
- MITSUBISHI三菱CC-Link IE现场网络Basic远程I_O模块用户手册.pdf
- 2025年公务员多省联考《申论》题(天津市区卷).docx VIP
- 《GNSS原理及应用》全套教学课件.pptx
- 偷窥漫画第一季完整.docx VIP
- 2023《传统资源型城市的产业转型问题研究—以辽宁鞍山市为例》7400字.docx VIP
- 新时代中国特色社会主义理论与实践课件-2024年高教版研究生新中特教材.pdf VIP
文档评论(0)