IRM第08讲-2009.ppt-网络教学综合平台.ppt

  1. 1、本文档共121页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
IRM第08讲-2009.ppt-网络教学综合平台.ppt

信息资源管理;讲义主要内容;第08讲;引言;5;6;7;8;9;10;引言;内容提要;8.1. 信息分析的统计学基础;8.1. 信息分析的统计学基础;8.1. 信息分析的统计学基础;8.1. 信息分析的统计学基础;8.1. 信息分析的统计学基础;8.1. 信息分析的统计学基础;19;20;8.1. 信息分析的统计学基础;22;8.1. 信息分析的统计学基础;8.1. 信息分析的统计学基础;8.1. 信息分析的统计学基础;8.1. 信息分析的统计学基础;8.1. 信息分析的统计学基础;8.1. 信息分析的统计学基础;8.1. 信息分析的统计学基础;异质性(标准差) ;斜度 ;;信息分析技术 统计分析技术 机器学习方法 不确定性理论 可视化技术 数据库技术。;信息分析技术;8.2. 信息分析技术;方差分析 相关分析 回归分析 因子分析 聚类分析;8.2. 信息分析技术;8.2. 信息分析技术;8.2. 信息分析技术;8.2. 信息分析技术;因子分析 因子分析实例:某公司为了了解消费者对牛肉、色、羊???、猪肉及鸡等五种肉类食物的偏好倾向,进行了一次市场调查。请1000位消费者对这五种肉类进行评分。评分采用十分制,分数越高表示越喜欢。调查结果列于下表。试用因子分析方法研究影响消费者选择食物的因素。 ;8.2. 信息分析技术;8.2. 信息分析技术;结果解析: 上表是SPSS11.0输出的旋转后的因子载荷矩阵,我们可以依此推断两个公共因子的含义。 从表中的数据来看,鸡、鱼、牛肉在第一公共因子的因子载荷值较高,而在第二公共因子的因子载荷值较低,故第一公共因子反映鸡、鱼、牛肉的公共特性。第一公共因子代表脂肪少。 而羊肉、猪肉在第二公共因子的因子载荷值较高,在第一公共因子的因子载荷值较低,这说明第二公共因子反映羊肉、猪肉的公共特性,第二公共因子代表价格。因而我们可以认为脂肪和价格是决定消费者肉类消费的主要因素。;聚类分析 聚类分析是把研究对象按照一定的规则分成若干类别,并使类之间的差别尽可能地大,类内的差别尽可能地小。 相似性是聚类的依据。 当研究的对象缺乏描述信息或无法组织成任何分类模式时,聚类分析可根据样本数据发现规律,从而找出全体数据的描述。 ;聚类分析 分类和聚类的差别: 分类是“分”而成类,由有形的整体对象分解为若干部分或分支; 聚类是“聚”而生类,从大量联系不明显甚至表面无联系的文献或数据中产生相关的群或集。;8.2. 信息分析技术; 一、聚类要素的数据处理 ; 假设有m 个聚类的对象,每一个聚类对象都有n个要素构成。它们所对应的要素数据可用表8.1给出。;在聚类分析中,常用的聚类要素的数据处理方法有如下几种: ;② 标准差标准化,即 由这种标准化方法所得到的新数据,各要素的平均值为0,标准差为1,即有 ;③ 极大值标准化,即 经过这种标准化所得的新数据,各要素的极大值为1,其余各数值小于1。 ④ 极差的标准化,即 经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。 ;例题:表8.2给出了某地区9个农业区的7项指标,它们经过极差标准化处理后,如表8.3所示。 ;表8.3 极差标准化处理后的数据;样品间的相似性度量-距离计算 设有n个样品的多元观测数据: xi=(xi1, xi2, ···, xip)T, i=1, 2, ···, n 每个样品可看成 p元空间的一个点,n个样品组成 p元空间的 n个点。用各点之间的距离来衡量各样品之间的相似程度。 设d(xi, xj)是样品xi和xj之间的距离,一般要求它满足下列条件: (1)d(xi, xj)≥ 0,且 d(xi, xj)= 0 当且仅当 xi= xj; (2)d(xi, xj)= d(xj, xi); (3)d(xi, xj)≤ d(xi, xk)+ d(xk, xj);二、距离的计算 ;④ 切比雪夫距离。当明科夫斯基距 时,有 据表8.3中的数据,用公式(8.5)式计算可得9个农业区之间的绝对值距离矩阵如下: ;三、谱系聚类法 ;谱系聚类法 谱系聚类方法是一种聚类较准确、实施较简单的聚类方法。 谱系聚类法的目的是根据给定数据产生一个层次结构。 基本过程:开始每个样品各成一类,然后相继将两个最相近的类合并成一个新类,直到所有的样品成为一个总类,从而得到一个按相似性大小聚结起来的谱系图。 ;聚类分析的方法: 谱系聚类法 类间相似性可用类间距离来衡量。常用的有最短距离、最长距离、重心距离和

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档