数模学习教材-第二十六章 多元分析.pdfVIP

  • 37
  • 0
  • 约24.6万字
  • 约 92页
  • 2017-10-16 发布于浙江
  • 举报
第二十六章 多元分析 多元分析(multivariate analysis )是多变量的统计分析方法,是数理统计中应用广 泛的一个重要分支,其内容庞杂,视角独特,方法多样,深受工程技术人员的青睐和广 泛使用,并在使用中不断完善和创新。 §1 聚类分析 将认识对象进行分类是人类认识世界的一种重要方法,比如有关世界的时间进程 的研究,就形成了历史学,有关世界空间地域的研究,则形成了地理学。又如在生物学 中,为了研究生物的演变,需要对生物进行分类,生物学家根据各种生物的特征,将它 们归属于不同的界、门、纲、目、科、属、种之中。事实上,分门别类地对事物进行研 究,要远比在一个混杂多变的集合中更清晰、明了和细致,这是因为同一类事物会具有 更多的近似特性。在企业的经营管理中,为了确定其目标市场,首先要进行市场细分。 因为无论一个企业多么庞大和成功,它也无法满足整个市场的各种需求。而市场细分, 可以帮助企业找到适合自己特色,并使企业具有竞争力的分市场,将其作为自己的重点 开发目标。 通常,人们可以凭经验和专业知识来实现分类。而聚类分析(cluster analysis )作 为一种定量方法,将从数据分析的角度,给出一个更准确、细致的分类工具。 1.1 相似性度量 1.1.1 样本的相似性度量 要用数量化的方法对事物进行分类,就必须用数量化的方法描述事物之间的相似 程度。一个事物常常需要用多个变量来刻画。如果对于一群有待分类的样本点需用p 个 变量描述,则每个样本点可以看成是R p 空间中的一个点。因此,很自然地想到可以用 距离来度量样本点间的相似程度。 记Ω是样本点集,距离d (⋅,⋅) 是Ω×Ω→R + 的一个函数,满足条件: 1)d (x , y ) ≥0 ,x , y ∈Ω; 2 )d (x , y ) 0 当且仅当x y ; 3 )d (x , y ) d (y , x) ,x , y ∈Ω; 4 )d (x , y ) ≤d (x , z ) +d (z ,y ) ,x , y , z ∈Ω。 这一距离的定义是我们所熟知的,它满足正定性,对称性和三角不等式。在聚类 分析中,对于定量变量,最常用的是 Minkowski 距离 1 ⎡ p q ⎤q dq (x , y ) ⎢∑xk −y k ⎥ ,q 0 ⎣k 1 ⎦ 当q 1,2 或q →+∞时,则分别得到 1 )绝对值距离 p d (x , y ) ∑xk −y k , (1) 1 k 1 2 )欧氏距离 1 ⎡ p 2 ⎤2 d (x ,y ) ∑x −y , (2 ) 2 ⎢ k k ⎥ ⎣k 1 ⎦ -581- 3 )Chebyshev 距离 d∞(x , y ) max xk −y k 。 (3 ) 1≤ ≤ k p 在 Minkowski 距离中,最常用的是欧氏距离,它的主要优点是当坐标轴进行正交

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档