大数据时代的数据挖掘与商务智能(三).ppt

大数据时代的数据挖掘与商务智能(三).ppt

  1. 1、本文档共239页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大数据时代的

数据挖掘与商务智能;

第三部分

基于统计的传统数据分析技术;数据分析基本概念;统计数据分析方法;数学家的幽默;何为统计学?;统计(Statistics)的涵义;统计的研究对象的特点;统计研究的基本环节;统计设计;收集数据;整理与分析;统计资料的积累、开发与应用;统计学的流派;政治算术学派与国势学派

;社会统计学派;数理统计学派;理论统计学和应用统计学;数学与统计学的联系;统计学与数学的区别;测量与数据;统计数据;变量与变量值;例:员工个人资料表;变量的测度等级;名义测度(Nominal);有序测度(Ordinal);间距测度(Interval);比率测度(Ratio);数据来源;总体和样本;总体参数和样本统计量;数据的类型;面板数据;非结构化数据;数据与模型的关系;数据的质量;数据的质量;数据的完整性;数据的准确性;数据的可比性与一致性;数据预处理;为什么需要预处理;脏数据形成的原因;数据清理的重要性;数据清理处理内容;空缺值;噪声数据;分箱(binning);分箱方法用于数据平滑;聚类;聚类(Clustering);计算机和人工检查相结合;回归;数据集成;数据变换;数据规范化;数据规约;属性子集选择;维规约;主成分分析 ;主成分分析(PCA);数值规约;*;聚类后抽样;离散化和概念分层;数值数据离散化和概念分层;数值概念分层;概念分层自动生成;数据预处理小结;统计数据分析方法;统计数据分析方法;描述统计的作用;描述统计;数据整理;数据分组;如何分组?;统计数据的分组;次数分配;某企业非熟练工人的月工资额(百元);变量次数分配的编制;确定组数与组距;分组计算;分6组,组距7;结合实际数据;按5组,10元作为组距,

计算次数。;次数分配表;作图;用excel作直方图;分两组;分组太细会出现什么问题?;分组数据的图示

(直方图的绘制);次数曲线;累计次数分布;统计表和统计图;示例数据;线形图(Linegraph);条形图(Barchart);圆饼图(Piechart);环形图

(doughnutchart);环形图;多变量数据—雷达图

(radarchart);多变量数据—雷达图

(雷达图的制作);多变量数据—雷达图

(例题分析);多变量数据—雷达图

(例题分析);*;散点图(ScatterDiagram);集中趋势和离中趋势;次数分配后有两个特征;???术平均值;加权算数平均数;算数平均值的好性质一;算数平均值的好性质二;均值的缺点;中位数;举例;众数;*;*;*;几何均值;表示变异(离散)程度的特征数;离散程度的测度;方差;标准差;用Excel计算描述统计量;Excel中的统计函数;数据分布特征和描述统计量;因变量(Y)与自变量(X)之间的关系

;变量之间的关系;函数关系;变量之间的关系;相关关系;总体相关系数;样本相关系数;样本相关系数;样本相关系数;相关关系的测度

(相关系数取值及其意义);相关性的可视化;*;相关分析中应注意的问题;推断统计;相关分析与回归分析;回归模型的类型;一元线性回归模型;一元线性回归模型假设;一元线性回归模型;一元线性回归模型;一元线性回归方程;一元线性回归方程;一元线性回归方程;一元线性回归方程;一元线性回归方程;模型适合性分析;误差项的异方差性检验;误差项的异方差性检验;误差项的自相性关检验;误差项的自相性关检验;误差项的自相性关检验;多元线性回归分析;多元线性回归分析的定义;多元线性回归模型;多元线性回归模型;多元线性回归模型;多元线性回归模型;多元线性回归模型;多元线性回归模型;参数的最小二乘估计;参数的最小二乘估计;参数的最小二乘估计;回归方程的显著性检验;总离差平方和分解;总离差平方和分解;样本决定系数对回归方程

“拟合优度”的检验;样本决定系数对回归方程

“拟合优度”的检验;样本决定系数对回归方程

“拟合优度”的检验;回归系数的显著性检验;时间序列分析;时间序列的成分;趋势成分;循环成分;季节成分;季节成分;季节成分;不规则成分;不规则成分;利用平滑法进行预测;利用平滑法进行预测;移动平均法;加权移动平均法;指数平滑法;指数平滑法;指数平滑法;指数平滑法;指数平滑法;示例;示例;利用趋势推测法进行预测;利用趋势推测法进行预测;利用趋势推测法进行预测;利用趋势推测法进行预测;利用趋势推测法进行预测;利用趋势推测法进行预测;利用趋势推测法进行预测;利用趋势推测法进行预测;利用趋势推测法进行预测;利用趋势推测法进行预测;拟合澳大利亚政府1981—1990年

每季度的消费支出序列;线性拟合;拟合效果图;非线性拟合;常用非线性模型;对上海证券交易所每月末上证指数

序列进行模型拟

文档评论(0)

182****9025 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档