统计学第六章 研究变量的关系:相关与回归.pdf

统计学第六章 研究变量的关系:相关与回归.pdf

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学第六章 研究变量的关系:相关与回归.pdf

第六章 研究变量之间的关系:相关与回归 以前各章的描述统计和推断统计集中在单 变量上,这是统计的基础。两个或多个变量 之间关系的研究是大部分研究的核心,是统 计应用的重点。多变量统计分析建立在单变 量分析工具上,指导原则是相同的: 作图表现数据,给出数值概括度量 寻找整体模式,讨论与模式的偏差 当整体模式比较规律,用一个简洁的数学 模型描述。 第一节分类数据之间关系研究:列联表 • 许多变量本身是分类变量,如性别、种族 和职业,其他分类变量由将数值变量的取 值分成若干个组而产生的。为了分析分类 变量的关系,需要使用落在各个类别中的 频数或频率,列联表(two-way table )是 概括分类数据关系的一种分析工具。 • 列联表结构:行变量、列变量、行和、列 和频数 第一节分类数据之间关系研究:列联表 • 例CASE7.1 音乐会影响购买行为吗? 列联表的分析开始于对单个变量分布的观察,即 边际分布。Stata命令:tabulate Wine Music [fweight = count] 第一节分类数据之间关系研究:列联表 • 分类变量间的关系可由条件分布的比较来描述: CASE7.1 条件分布的比较: 第一节分类数据之间关系研究:列联表 • Simpson 悖论: An association or comparison that holds for all of several groups can reverse direction when the data are combined to form a single group. This reversal is called Simpson’s paradox. 启发:Conclusions that seem obvious when we look only at aggregated data can become quite different when the data are examined in more detail. 第一节分类数据之间关系研究:列联表 Example: 第一节分类数据之间关系研究:列联表 • 统计检验: The null hypothesis H0 of interest in a two-way table is there is no association between the row variable and the column variable. The alternative hypothesis Ha is that there is an association between these two variables. The alternative Ha does not specify any particular direction for the association. For r ×c tables in general, the alternative includes many different possibilities. Because it includes all the many kinds of association that are possible, we cannot describe Ha as either one-sided or two-sided. 第一节分类数据之间关系研究:列联表 • 检验方法:To test the null hypothesis in r ×c tables, we compare the observed cell counts with expected cell counts calculated under the assumption that the null hypothesis is true. Our test statistic is a numerical measure of the distance between the observed and expected cell counts. 第一节分类数据之间关系研究:列联表 • Chi方检验: 第一节分类数据之间关系研究:列联表 卡方检验:

文档评论(0)

suijiazhuang1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档