- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
定性变量间的相关分析——交叉列联表分析 交叉列联表分析是同时描述两个或两个以上变量联合分布的统计技术。 进行交叉列联分析的变量必须是离散变量,并且只能有有限个取值,否则要进行分组。 居住时间与对百货商场的熟悉程度的交叉列联分析 单位:频数 熟悉程度 居住时间 ? 13年以下 13-30年 30年以上 合计 不熟悉 45 34 55 134 熟悉 52 53 27 132 合计 97 87 82 266 居住时间与对百货商场的熟悉程度的交叉列联分析 单位:% 熟悉程度 居住时间 13年以下 13-30年 30年以上 不熟悉 46.4 39.1 67.1 熟悉 53.6 60.9 32.9 合计 100.0 100.0 100.0 列百分比 居住时间与对百货商场的熟悉程度的交叉列联分析 单位:% 熟悉程度 居住时间 ? 13年以下 13-30年 30年以上 行合计 不熟悉 33.6 25.4 41.0 100.0 熟悉 39.4 40.1 20.5 100.0 行百分比 比较上面两个表,你选择哪种百分比? 建议:对自变量取百分比 自变量为列变量,取列百分比 自变量为行变量,取行百分比 对3个以上的变量进行交叉列联分析,不易解释。一般来说,每个单元格至少要有5个观察值才有说服力。 使用电脑的程度与年龄成反比 不同文化程度的公众在工作中使用电脑的情况 定量变量间的相关分析 吸烟与否与患肺癌与否? 收入与消费? 纳税人年龄与税款数量? 孕妇饮酒量与婴儿体重? 农作物采光量与生长? 相关分析的一般步骤 由数据看变量有关系吗? 如果有关系,变量间关系有多强? 总体中是否也有此关系? 此关系是否因果关系? 定量变量间的相关分析 ——散点图 散点图: 可以直观地看出变量间的关系形态及联系程度。 线性相关和非线性相关 正相关和负相关 劳动生产率与利润总额散点图 ? 云南 内蒙 定量变量间的相关分析 ——相关系数 相关系数描述两数值变量之间线性相关的方向和强度. 又称PEARSON相关系数 相关系数通常用符号 r 表示 相关关系的测度 相关系数描述两数值变量之间线性相关的方向和强度. 样本相关系数的计算公式 或化简为 相关系数取值及其意义 -1.0 +1.0 0 -0.5 +0.5 完全负相关 无线性相关 完全正相关 负相关程度增加 r 正相关程度增加 相关系数 r 的取值范围是 [-1,1] 若|r|≥0.8,则认为和高度相关; 若0.5≤|r|<0.8,则认为和中度相关; 若0.3≤|r|<0.5,则认为和低度相关; 若|r|<0.3,则认为和之间的相关程度极弱,可视为不相关。 使用相关系数的注意事项 r =0只表示和之间不存在线性相关关系,并不是说和之间不存在任何关系,它们间可能存在非线性关系。 r大小可能受极端值的影响,不能准确度量变量间的关系,例如多数观察值存在线性相关,但个别极端值使数据呈非线性相关。 r所表现的相关程度同样本数据的时间范围有很大关系,在不同时间段,变量间的相关性可能不同。 r用样本数据计算的带有一定随机性,尤其样本量较少时,可能出现虚假相关。因此,实际应用时,必须对它的显著性进行检验。 斯皮尔曼(spearman)相关系数 定序变量等级相关程度 取值范围在-1和+1之间 本章结构 多元统计分析 3. 描述统计分析 2. 概述 1. 调查结果的展示 4. 第三节 多元统计分析 聚类分析 1. 判别分析 2. 对应分析 4. 因子分析 3. 结合分析 5. 多元统计分析——聚类分析 聚类分析(Cluster analysis 依据某种准则对个体(样品或变量)进行分类的一种多元统计分析方法。 比如:在一项全国范围的市场调查中,需要对我国32个省/市/自治区的经济发展状况进行分析。一般不是逐个省/市/自治区去分析,较好的作法是选取能反映经济发展状况的有代表性的指标,如国民生产总值(GNP)、工农业总产值、第三产业比重、固定资产投资额、人均国民收入、城市和农村平均每人月收入及通货膨胀率等指标,根据这些指标对32个省区进行分类。然后依据分类结果,对经济发展情况进行综合评价 应用 市场细分。例如可以根据消费者购买某产品的各种目的把消费者分类,这样每个类别内的消费者在购买目的方面是相似的。 了解购买行为。聚类分析可以把购买者分类,这样有助于分别研究各类购买行为。 开发新产品。对产品与品牌进行聚类分析,把它们分为不同类别的竞争对手。在同一类别的品牌比其他类的品牌更具有竞争性。公司可以通过比较现有竞争对手,明确新产品的潜在机遇。 选择实验性市场。通过把不同城市分类,选
文档评论(0)