数据分析工具使用.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与知识发现 数据分析工具使用;目录;3;一辆火车行驶在草原上,遇到一群白色的羊…….. 物理学家说,我们看到的羊群是白色的 数学家说,我们看到的羊群朝向我们这面的那部分是白色的 统计学家说,我们看到了103只羊,它们都是白色的,我推断天下的羊都是白色的;数据无处不在,我们每天生活在数据的海洋中。 数据包含的信息很多,但是数据中的信息往往是分散的,单个数据很难直接被应用起来。;请问A、B两公司的差距大吗?;请问A、B两公司的差距大吗?;请问A、B两公司的差距大吗?;请问:A、B哪个业务发展的快?;原来竟然一样快!;请问A、B两公司的差距大吗?;请问A、B两公司的差距大吗?;理念;电梯测验;关于数据分析的几点思路;数据分析技术:定性分析与定量分析;什么时候用数据分析;18;19;SPSS模块与分析过程;目录;22;23;24;25;26;27;28;29;30;目录;32;利用算术符号和函数生成新变量 (Compute): 举例: 销售总额 = 单价×数量×(1 - 折扣) 平均成绩 = (语文成绩 + 数学成绩 + 英语成绩)÷ 3 平均成绩 = average(各科成绩) 年龄 = 当前年份 – 出生年份 姓名 = 姓 + 名;34;新变量代表名次(Rank Cases) 举例: 对按平均成绩排名,分数最高的为第一名。 相同分数的名次处理:同小、同中、同大 排序Sort Cases: 升降序 多个变量排序 ;36;按分数规定等级——Recode 规则:不重且不漏 例: 90以上为A,75-89为B,60-74为C,60以下为D 例: A级人数占总人数的25%,B—25%,C—25%,D—25% 例: A级—10% B—50%,C—30%,D—10% ;38;39;40;41;42;按一个分类变量汇总 如性别 按多个分类变量汇总 如性别、年龄段 对一个变量进行多个统计量的汇总 例如销售总额、平均每笔销售额 生成次数变量:成交次数 汇总生成新文件或直接显示在数据窗口;44;第一种:一条记录变成多条记录 第二种:多条记录变成一条记录 第三种:3行×200列变成200行×3列 ;自动发现重复记录;47;48;目录;尽量精确、直观而全面的对所获得的样本进行呈现 统计图:直观,但精确度稍差 常规统计图:主要的使用部分 交互式统计图:功能非常强大,但操作也较复杂 统计地图:将数据与地图相结合 统计???表:能尽量详细,精确,但不够直观 Base模块:基本上满足需要 Tables模块:专业级报表输出,操作方便快捷;51;交互式统计图;53;以直条长短来表示各指标数值的大小(cover.sav) 一个分类变量:简单条图(各城市的日销售额) 两个分类变量:复式条图(销售额先按城市,再按包装类细分) 分组条图:便于个亚组内部比较(不同包装亚组) 堆积条图:便于大分类整体比较(不同城市间);SPSS图形;以点的密集程度和趋势表示两变量间的数量依存关系 两变量间关系:简单散点图 快速发现多个变量间主要相关性:散点图矩阵 在同一张图中比较各组变量的相关性:重叠散点图 三个连续变量间的关系:三维散点图;描述统计学—— 研究如何把数据用易于理解的形式展示出来,结果可能是表格、图形或者数值 推断统计学—— 利用部分数据对总体数据的规律性做出预测和检验,为了实现这一功能,统计学家建立了大量的统计模型;描述统计量(Summary Statistic),也称汇总统计量或概括统计量 用少量数字概括大量数字的技术;数据的“位置” 位置统计量(location statistic):均值、中位数、K-百分位数、众数 数据的“尺度” 尺度统计量(scale statistic):极差、标准差;频数表 Frequency 直观的方法 :分布类型/分布特征 集中趋势 Central tendency 均数mean 调整平均数 中位数median 众数mode 离散趋势 Dispersion tendency 全距Range 方差Variance 标准差 std.deviation;61;例1:试以文字诠释以下随机抽取某单位20名员工的年龄: 41 25 25 33 27 31 42 35 36 32 36 41 34 29 34 31 34 35 32 35 ?平均数=33.4, 中位数=34.0, 标准差=4.75, 全距=17。;例2:试以文字诠释以下随机抽取某单位20名员工去年请假的天数: 0 0 0 0 0 0 0 0 1 1 1 2 2 3 4 5 5 6 7 42 ?

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档