数据分析方法与技术作业及答案分解.docxVIP

数据分析方法与技术作业及答案分解.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、填写题(抄题,写答案) 数据分析“六步曲”按顺序依次是: 明确分析目的和内容 、 数据收集 、 数据处理 、 数据分析 、 数据展现 、 报告撰写 。 定量数据一般可分为 计量的 、 计数的 、二种类型。定性数据一般可分为 有序的 、 名义的 、二种类型。 数据收集方法总的可分为 一手数据 、二手数据 、两大类。前一类方法常用的具体方法有 调查法 、 观察法 、 实验法 ;后一类方法常用的具体方法有 机构查询 、 书刊查询 、 网络查询 。 SPSS中有三种主要的工作窗口,它们是: 数据编辑窗口 、 结果浏览窗口 、 程序编辑窗口 ; 在进行数据表编辑时,有二种主要视图,它们是: 数据视图 、 变量视图 。 SPSS中对变量属性进行定义时,对变量的命名在 Name 栏中设置,定义变量值标签在 Values 栏中设置。 根据数据的计量性质,可以将数据分为 定量的 数据和 定性的 数据;根据数据获得的直接性,可以将数据分为 一手 数据和 二手 数据。 统计检验的一种思路是:设定原假设 H0,构造相应的统计判断量,当根据实验数据或样本数据计算出的统计判断量 落在拒绝区域 ,则拒绝原假设;反之,则 落在接受区域,接受原假设 。在SPSS软件的统计操作中,通过计算样本数据的实际显著性概率Sig.,并将其与给定的显著性概率水平 比较,当 Sig. 时(填 “” 或 “” ),则拒绝原假设。 方差分析主要用来判断样本数据之间的差异是由 不可控的随机因素 造成的还是由 研究中施加的对结果形成影响的可控因素 造成的。 因子分析法是 多元统计分析中处理降维 的一种,其最主要的工作是 降维 ,即 将具有错综复杂关系的变量或者样品综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系 。 下图所示因子分析结果中,数值6.845的含义是 第一主成分特征根 ,数值84.421的含义是 前三个主成分的累计贡献率;在Extraction Sums块中,有三行数据,其含义是 根据提取因子条件----特征值大于1,共选出了三个公共因子 。 下图所示椭圆圈中信息的含义 11变量,200样例 。 强规则是指: 同时满足最小支持度阈值和最小置信度阈值???规则 。 Statistica中实现聚类分析的过程是:[Statistics]/[ Multivariate Exploratory Techniques]/ [ Cluster Analysis ]。 在对二值变量定类数据的距离进行计算时,若认为所取两个值的地位不对等,则可以用 雅克比匹配系数 对距离进行度量。 熵可以作为训练集的 不纯度 度量,熵越大, 不纯度 就越 高 (高或低)。决策树的分枝原则就是使划分后的样本的子集越 纯 越好,即它们的熵越 小 越好。 CRT算法的全称是 Classification and Regression Trees ,它所构成的决策树是 二叉树 ,该算法用 gini指标 指标作为选择分枝方案的依据,在选择分枝方案时,需经两步完成,第一步, 在每个节点处评估所有属性的每个标准问题的 gini 指标 ,第二步, 选择gini 指标最大的标准问题作为分枝方案 。 已知某数据集中某属性的不同取值为,{2.6,1, 2.9, 2,5,4.2,2.3,3 },则该属性的标准问题集为 {Is A≤1.5,Is A≤2.15,Is A≤2.45,Is A≤2.75,Is A≤2.95,Is A≤3.6,Is A≤4.6} 。 已知某数据集中某属性的不同取值为,{优,良,中,差},则该属性的标准问题集为 {Is A∈{优},Is A∈{良},Is A∈{中},Is A∈{优,良},Is A∈{良,中},Is A∈{优,中},Is A∈{优,良,中}。 二、单项选择题(抄题干及你认为正确的选项,图可以不画) Excel中,当把F7单元格复制到G8单元格时出现了如下信息提示,关于这一现象,以下描述正确的是( C )。 (A) G8单元格的数据应该是17,可能格式设置为小数点后5位,超过了单元格显示区域,出现此提示 (B) C8或D8单元格的数据有问题 (C) D8和E8不能相加 (D) F8为空值,无法加总得到结果 在Excel中,要实现如下图所示的汇率换算,可以在D5单元格中输入(B ),之后将它复制到下面的单元格,就可以实现不同币值的换算。 (A) $C$2*C5 (B) =C$2*C5 (C) =6.912*786 (D) =C2*C5 以下关于SPSS中定义变量值标签的描述中,错误的是(C) (A) 定义值标签可简化数据录入

文档评论(0)

jiayou10 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档