- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与知识发现数据分析工具使用;目录;3;一辆火车行驶在草原上,遇到一群白色的羊……..
物理学家说,我们看到的羊群是白色的
数学家说,我们看到的羊群朝向我们这面的那部分是白色的
统计学家说,我们看到了103只羊,它们都是白色的,我推断天下的羊都是白色的;数据无处不在,我们每天生活在数据的海洋中。
数据包含的信息很多,但是数据中的信息往往是分散的,单个数据很难直接被应用起来。;请问A、B两公司的差距大吗?;请问A、B两公司的差距大吗?;请问A、B两公司的差距大吗?;请问:A、B哪个业务发展的快?;原来竟然一样快!;请问A、B两公司的差距大吗?;请问A、B两公司的差距大吗?;理念;电梯测验;关于数据分析的几点思路;数据分析技术:定性分析与定量分析;什么时候用数据分析;18;19;SPSS模块与分析过程;目录;22;23;24;25;26;27;28;29;30;目录;32;利用算术符号和函数生成新变量 (Compute):
举例:
销售总额 = 单价×数量×(1 - 折扣)
平均成绩 = (语文成绩 + 数学成绩 + 英语成绩)÷ 3
平均成绩 = average(各科成绩)
年龄 = 当前年份 – 出生年份
姓名 = 姓 + 名;34;新变量代表名次(Rank Cases)
举例:
对按平均成绩排名,分数最高的为第一名。
相同分数的名次处理:同小、同中、同大
排序Sort Cases:
升降序
多个变量排序 ;36;按分数规定等级——Recode
规则:不重且不漏
例:
90以上为A,75-89为B,60-74为C,60以下为D
例:
A级人数占总人数的25%,B—25%,C—25%,D—25%
例:
A级—10% B—50%,C—30%,D—10% ;38;39;40;41;42;按一个分类变量汇总
如性别
按多个分类变量汇总
如性别、年龄段
对一个变量进行多个统计量的汇总
例如销售总额、平均每笔销售额
生成次数变量:成交次数
汇总生成新文件或直接显示在数据窗口;44;第一种:一条记录变成多条记录
第二种:多条记录变成一条记录
第三种:3行×200列变成200行×3列
;自动发现重复记录;47;48;目录;尽量精确、直观而全面的对所获得的样本进行呈现
统计图:直观,但精确度稍差
常规统计图:主要的使用部分
交互式统计图:功能非常强大,但操作也较复杂
统计地图:将数据与地图相结合
统计???表:能尽量详细,精确,但不够直观
Base模块:基本上满足需要
Tables模块:专业级报表输出,操作方便快捷;51;交互式统计图;53;以直条长短来表示各指标数值的大小(cover.sav)
一个分类变量:简单条图(各城市的日销售额)
两个分类变量:复式条图(销售额先按城市,再按包装类细分)
分组条图:便于个亚组内部比较(不同包装亚组)
堆积条图:便于大分类整体比较(不同城市间);SPSS图形;以点的密集程度和趋势表示两变量间的数量依存关系
两变量间关系:简单散点图
快速发现多个变量间主要相关性:散点图矩阵
在同一张图中比较各组变量的相关性:重叠散点图
三个连续变量间的关系:三维散点图;描述统计学——
研究如何把数据用易于理解的形式展示出来,结果可能是表格、图形或者数值
推断统计学——
利用部分数据对总体数据的规律性做出预测和检验,为了实现这一功能,统计学家建立了大量的统计模型;描述统计量(Summary Statistic),也称汇总统计量或概括统计量
用少量数字概括大量数字的技术;数据的“位置”
位置统计量(location statistic):均值、中位数、K-百分位数、众数
数据的“尺度”
尺度统计量(scale statistic):极差、标准差;频数表 Frequency
直观的方法 :分布类型/分布特征
集中趋势 Central tendency
均数mean
调整平均数
中位数median
众数mode
离散趋势 Dispersion tendency
全距Range
方差Variance
标准差 std.deviation;61;例1:试以文字诠释以下随机抽取某单位20名员工的年龄:
41 25 25 33 27 31 42
35 36 32 36 41 34 29
34 31 34 35 32 35
?平均数=33.4,
中位数=34.0,
标准差=4.75,
全距=17。;例2:试以文字诠释以下随机抽取某单位20名员工去年请假的天数:
0 0 0 0 0 0 0 0 1 1
1 2 2 3 4 5 5 6 7 42
?
您可能关注的文档
最近下载
- 《电气装置安装工程接地装置施工及验收规范+GB+50169-2016》详细解读.pdf
- THKA多回路智能工业调节器.PDF VIP
- 2025年广西专业技术人员继续教育公需科目(二)答案.docx VIP
- NDS世界树迷宫流程攻略及基础知识.pdf VIP
- 山西煤炭运销集团三百子煤业有限公司120万ta矿井兼并重组整合项目及配套120万ta洗煤厂环境影响报告书简本.doc VIP
- 苏州石刻《天文图》文字.pdf
- 中国气悬浮离心压缩机行业市场占有率及投资前景预测分析报告.pdf VIP
- 米家米家智能蒸发式冷风扇使用说明书.pdf
- 薄层砌筑和薄层抹灰工程施工技术方案.docx VIP
- 2024-2025学年中职语文基础模块 下册高教版(2023)教学设计合集.docx
文档评论(0)