- 1、本文档共93页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘项目交流;目录;Why?;应用: 运用模型辅助决策,制定营销策略;Data Mining is for
power users to follow a
proven methodology to
discover action-oriented insights from
detail operations data to improve business.
数据挖掘是分析专家用已验证的方法在业务细节数据中
发掘出可采取行动的洞察力,从而改善企业运营。;数据 = 储藏室
数据 + 工具 = 网吧
数据 + 工具 + 方法 = 信息
数据 + 工具 + 方法 + 目标 = 知识
数据 + 工具 + 方法 + 目标 + 行动 = 价值;客户;数据挖掘典型应用;分析专题示例;目录;What is Teradata Warehouse Miner?;;TWM-场内挖掘的优势;单变量统计
Count/Minimum/Maximum/Mean
Standard Deviation
Standard Mean Error
Variance
Coefficient of Variance
Skewness
Kurtosis
Uncorrected Sum of Squares
Corrected Sum of Squares
Modes
基本数据质量分析
Data Types
Count
# NULL Values
# Positive Values
# Negatives Values
# Zeros
# Blanks
# Unique Values
;相关???析
Quickly view correlations across variables
数据探索器
Performs basic statistical analysis on a set of tables and selected columns within any Teradata database
Intelligent decisions about which functions to perform
Values Analysis - Every column in the set of input tables
Univariate Statistical Analysis - Every column of numeric or date type
Frequency Analysis - Every column that has less than or equal to a number of unique values
Histogram Analysis - Every numeric or date type column that has more than a number of unique values;变量生成
Aggregations
Count, Average, Sum etc.
Windowed Aggregates/OLAP
Rank, Quantililes, Moving Sums, etc.
Arithmetic operators/functions
: +, -, *, /, MOD, **
ABS, EXP, LN, LOG, SQRT, etc.
Trigonometric Hyperbolic functions
COS, SIN, TAN, ACOS, etc.
COSH, SINH, TANH, ACOSH, etc.
CASE expressions and NULL operators
valued and searched types
NULLIF, COALESCE
Comparison operators
=, , , , =, =
Logical predicates
BETWEEN…AND…, IN (expression list), etc.;变量变换
Bin Coding
Design Coding
Recoding
Rescaling
Derive
Hook to Variable Creation
Statistical Transformations
Z-Score
Sigmoid
NULL Value Replacement
Literal value
Mean value
Median value
Mode
Imputed values;Normality/Equality Tests
Kolmogorov-Smirnov
Lilliefors Test
Shapiro-Wilk
D’Agostino Pearson Omnibus
Smirnov
分
您可能关注的文档
- 第一讲创新与创造力案例集.ppt
- 第一讲算符及其本征值与本征函数.ppt
- 第一节 走近细胞.ppt
- 第一篇_铸铁及其熔炼.ppt
- 第一章 从建安风骨到正.ppt
- 第一章 印刷技术发展史.ppt
- 第一章 招远市城市总体规划概要.doc
- 第一章 追求远大理想 坚定崇高信念.ppt
- 第一章追求远大理想坚定崇高信念_思想道德修养与法律基础刘旭萌.ppt
- 第一周做高素质的小学教师学习笔记.doc
- 期末复习课件++专题7+阿基米德原理++2023-2024学年人教版八年级物理下册.pptx
- 4-1电磁振荡(教学课件)高中物理人教版选择性必修第二册.pptx
- 本包含页空白页.pdf
- 【会计实操经验】财务操纵的知识框架.pdf
- 英国b2c电商网站ocado市场前景及投资研究报告-培训课件外文版2024.6,拼多多,阿里巴巴,1688,temu,tiktok.pdf
- 印尼在线约会行业市场前景及投资研究报告-培训课件外文版2024.6,微信,tiktok.pdf
- 印尼物联网IOT行业市场前景及投资研究报告-培训课件外文版2024.5.pdf
- 印尼斋月消费情况分析报告-培训课件外文版2024.6.pdf
- 英国GDP分析报告-培训课件外文版2024.6.pdf
- 印尼铁路行业市场前景及投资研究报告-培训课件外文版2024.6,援建高铁.pdf
文档评论(0)