商务调查与分析第九讲:数据编码与分布描述.pptVIP

商务调查与分析第九讲:数据编码与分布描述.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商务调查与分析第九讲:数据编码与分布描述

商务调查与分析 第九讲:数据编码与分布描述 国际商学院 数量分析与统计系 讲授:杨震宁 目录 数据编码 数据分布描述 数据编码与分布描述 管理研究需要对用各种方式收集到的信息进行编码、分析和解释。也就是说,信息要转换成为便于存贮和统计分析的数据。 通过对经过编码的数据进行分布描述和研究,我们才能知道这些数据是否支持理论假设。 数据矩阵 研究中收集到的信息,需要进行整理,通常的做法是建构一个数据矩阵,矩阵的行是分析单位,矩阵的列是分析变量,矩阵的单元格中是原始数据。 每个个体或组织都可以看成是一个分析单位,分析单位的确定依赖于研究人员所要研究的问题。比如,在国际经济关系研究中,国家可以看作一个分析单位。 数据矩阵示例 举例:信息沟通有效性研究 例如,对一个组织内部上下级之间信息沟通的有效性进行研究。通常,在组织沟通中,影响沟通有效性的因素表现为5个方面: 信息是否扭曲; 信息是否遗失; 信息是否冗余(信息冗余会使接受者不知所措,无法作出理性决策); 信息的及时性; 信息的可接受度(信息有效利用的前提是得到接受者的认同)。 数据矩阵的结构 可以设计一个问卷对组织成员进行调查。假定选取100个组织成员作为样本进行调查,提出涉及以上5个方面的10个问题要他们回答。调查得到的信息可以整理成一个数据矩阵。 每个被调查者都是一个分析单位,影响沟通有效性的每个因素都是一个分析变量。这个数据矩阵就有100行,10列。矩阵中的每一元素都包含着某个人回答一个特定问题的有关信息。 变量赋值 矩阵中每个元素包含的是编码后用于分析的数据。例如,在组织沟通有效性调查中,关于上级所获得的信息是否扭曲的问题是: 问题: 当你与上级交谈时,是否总是突出一些让自己脸上有光的事情? 选项: (1)完全是这样做的(2)基本上是这样做的 (3)偶尔这样做(4)基本上不这样做 (5)完全不这样做 变量赋值 如果这5个选项分别编码为1、2、3、4、5,同时,预留个别数值,例如9,用于编码无效或未回答的数据。 将这些编码填入相应的数据矩阵单元,数据矩阵就包含了每个接受调查者对给定问题答复的信息。 对这些答复进行数字化编码是为了便于用计算机分析。 变量赋值的规则 对于用分类尺度度量的变量,可以随意赋值对其编码,但要保持前后一致性。这类变量如被调查者的性别、职级等。 对于用序数、区间或比率尺度度量的变量,不能随意赋值对其编码。这些尺度度量值中包含了不同度量值的排序信息,这些排序信息至少要保留在对其编码的数值中。 变量赋值的规则 对于区间和比率尺度,度量的单位是有意义的。因此,对于用这些尺度度量的变量,编码表中不仅要保留其度量值的排序信息,而且要包含它们间的相对区别。 对于比率尺度,零的定义是有意义的,度量值将依此而确定。 输入数据的检查 当数据被输入计算机后,有必要彻底、反复地检查输入的数据是否存在错误。 可以采用以下两种方法检验: 将数据输入2次,用计算机检查这两个矩阵是否一致性。 利用统计分析软件检查,它可以去掉那些不一致的数值,但应注意的是,这种方法也可能去不掉那些有错的数值,可能掩盖对一个矩阵是有效的但可能是有错的值。 编码册 编码册是关于数据矩阵结构和编码设定的记录。编码册的基本用途是保证数据矩阵中记录的数据在将来能够被解释。 编码册中记录了数据矩阵的每列的信息,这些信息包括每列中占用的变量名及编码变量的值。 对有些无效数据需要加以分类,分别编码。用于编码无效数据的数值应是变量正常情况下不会出现的数值。如上例中“未回答”编码为9,无效数据编码为99。 编码册示例 变量分布描述 数据收集和编码后,需要对其分析和解释。分析是为了找到研究问题的答案,解释是通过联系其它可获得知识而给予答案更广泛的内涵。 数据分析和解释不仅仅是研究过程中提出假设、研究设计和数据收集之后的一步,研究实际上是个循环的过程,数据分析通常可以产生更进一步的假设,通过数据分析和解释甚至会得到一些意外的收获。 中国上市公司2005年财务数据矩阵 数据分布的直观描述 上表是1372个中国A股上市公司2005年财务数据的数据矩阵。矩阵中的分析单位是公司;每个公司有4个分析变量:净资产收益率、资产负债率、销售增长率、利润增长率,变量度量采用比率尺度。 对表中的数据,我们可以分别用频率分布曲线图、分组频率分布柱状图、主干分枝图直观地描述其分布情况。 频数分布和累加频数分布曲线图 将数据从小到大排序,计算每个数据出现的频数,根据每个数据及其频数可画出频率分布曲线。 从小到大计算每个数据的累加频数,根据每个数据及其频数可画出频率分布曲线。 将数据分组,分别统计每组频数,依此可画出分组频率分布柱状图。 上市公司净资产收益率频数分布图 上市公司净资产收益率累加频数分布图 分组频数分布柱状图 主干分枝

文档评论(0)

zhuliyan1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档