- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 1 章 P20
1. 在数据处理时,为什么通常要进行标准化处理?
对数据进行标准化处理主要为了消除变量的量纲以及量纲差别较大时所带
来的影响,尤其当变量间的单位不同且量级差别特别大时,使用不做任何处理的
数据进行计算,可能会得到极不合理的结果。
2. 欧氏距离与马氏距离的优缺点是什么?
欧氏距离是计算点与点之间距离的常用方法,其缺点是坐标的各维度对计算
距离的贡献是同等的,距离的大小与各维度对应的指标变量的单位有关。因此,
对于大部分统计问题,欧氏距离不太适合。而马氏距离弥补了欧氏距离在统计问
题上的缺陷,马氏距离的计算中会将各指标变量转化为无量纲的数值,而且当变
量服从或渐近服从多元正态分布时,马氏距离具有良好的统计性质。
3. 当变量X1和X2方向上的变差相等,且X1与X2互相独立时,采用欧氏距离与统
计距离是否一致?
当变量X1和X2方向上的变差相等,且X1与X2互相独立时,采用欧氏距离与统
计距离的计算结果会相差一个常数倍,即欧氏距离=统计距离*C,该常数项C 为
变量X1和X2 的标准差。
4. 如果正态随机向量X = (x1, x2, …, x )′的协方差阵Σ是对角阵,证明X 的分量是
相互独立的随机变量。
证明:不妨设Σ = diag(2, …, 2) ,X 的均值向量为μ = ( , …, ) ,则
1 1
X~N(μ, Σ). X 的概率密度函数为:
1 1
− − ′ −1
( ) 2 | | 2 ( ) ( )
( , …, ) = 2 Σ exp {− X − μ Σ X − μ }
1 2
− −1 −1
= (2) 2 ⋯
1
−2 ⋯ 0 1 − 1
1 1
∙ exp {− ( − , …, − ) ( ⋮ ⋱ ⋮ ) ( ⋮ )}
2 1 1 −2
0 ⋯ −
2
− −1 −1 1 ( − )
= (2) 2 ⋯ ∙ exp {− ∑ }
1 2 2
文档评论(0)