- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘及其应用PPT
数 据 挖 掘 及 其 应 用 数据挖掘及其应用 Data Mining and its Applications 印 鉴 中山大学信息科学与技术学院 主要内容 动机: 为什么要数据挖掘? 什么是数据挖掘? 数据挖掘: 在什么样的数据上挖掘? 数据挖掘功能 所有的模式都是有趣的吗? 数据挖掘的主要问题 应用例子 为什么要数据挖掘? 数据的爆炸性增长: 从TB到PB 数据收集和数据可用性 自动的数据收集工具, 数据库系统, Web, 计算化的社会 丰富数据的主要来源 商业: Web, 电子商务, 事务, 股票, … 科学: 遥感, 生物信息学, 科学仿真, … 社会: 新闻, 数码相机, 我们正淹没在数据中, 但却渴望知识! “需要是发明之母”—数据挖掘—自动化的大规模数据集分析 数据库技术的演化 1960s: 数据收集, 数据库创建, 信息管理系统IMS和数据库管理DBMS 1970s: 关系数据模型, 关系DBMS实现 1980s: RDBMS, 高级数据模型 (扩展关系的, OO, 演绎等.) 面向应用的DBMS (空间, 科学, 工程等.) 1990s: 数据挖掘, 数据仓库, 多媒体数据库, 和Web数据库 2000s 流数据管理和挖掘 数据挖掘和它的应用 Web技术(XML, 数据集成) 和全球信息系统 什么是数据挖掘? 数据挖掘 (从数据中发现知识) 从海量数据中提取感兴趣(重要的, 隐含的, 以前未知的 和 潜在有用的)模式或知识 数据挖掘: 用词不当? 其他的名称 数据库中的知识发现 (挖掘) (KDD), 知识提取, 数据/模式分析, 数据考古学, 数据捕捞, 信息收获, 商业智能等. 当心: 所有的都是“数据挖掘”么? 简单的搜索和查询处理 (演绎的) 专家系统 为什么要数据挖掘?—潜在的应用 数据分析和决策支持 市场分析和管理 目标市场定位, 客户关系管理 (CRM), 购物篮分析, 交叉销售 风险分析和管理 预测, 客户保持, 质量控制, 竞争分析 欺诈检测和不寻常模式的检测 (离群点) 其他的应用 文本挖掘 (新闻组, email, 文档) 和Web挖掘 流数据挖掘 生物信息学和生物数据分析 Ex. 1: 市场分析和管理 数据从哪来?—信用卡交易事务, 会员卡, 优惠券, 客户投诉电话, 公众生活方式研究 目标市场 寻找“榜样”客户的聚类,他们共享相同的特征: 兴趣, 收入水平, 消费习惯等 确定客户在一段时间的购买模式 交叉市场分析—寻找产品销售之间的关联/相关性,以及基于这些关联进行预测 客户轮廓(profile)—什么类型的客户买什么产品 (聚类或分类) 客户需求分析 为不同的用户识别最好的产品 预测什么因素将吸引新的客户 摘要信息提供 多维摘要信息报告 统计学总结信息 (数据中心的趋势和变化) Ex. 2: 公司分析和风险管理 财经计划和资产评估 现金流分析和预测 资源计划 总结比较资源和开销 竞争 监控竞争对手和市场方向 细分客户类别,制定基于类别的定价过程 在激烈竞争市场中建立价格策略 Ex. 3:欺诈检测和挖掘异常模式 方法: 为欺诈和离群点分析进行聚类和模型构建 应用: 医疗保健, 零售业, 信用卡服务, 电信业. 汽车保险:检测出那些故意制造车祸而索取保险的人 洗钱: 可疑的资金流向 医疗保险 检测出职业病人 不必要、不相关的医学检验 电信业: 电话欺诈 电话模式:呼叫目的地,持续时间,每天或每周的次数。分析与预期标准相背离的模式 零售业 分析师评估认为38%的零售业萎缩是因为不诚实的雇员 反恐怖主义 知识发现 (KDD) 过程 数据挖掘—知识发现过程的核心 数据挖掘: 多种技术的融合 为什么不是传统的数据分析? 庞大的数据 算法必须能够高度可伸缩以便处理TB数量级的数据 高维度的数据 Micro-array 可能有成千上万个维度 数据的高复杂性 数据流和传感器数据 时间序列数据, 时间数据, 序列数据 结构数据, 图, 社会网络和多链接数据 异构数据库和遗产数据库 空间, 时空, 多媒体, 文本和 Web 数据 软件程序, 科学仿真 新的和复杂的应用 数据挖掘: 在什么样的数据上进行? 面向数据库的数据集及其应用 关系数据库, 数据仓库, 事务数据库 高级数据集和高级应用 数据流和传感器数据 时间序列数据, 时间数据, 序列数据(包括生物序列数据) 结构数据, 图, 社会网络和多链接数据 对象-关系数据库 异构数据库和遗产数据库 空间, 时空数据 多媒体 文本数据库 World-Wide Web 数据挖掘功能 多维概念描述: 特征和区分 概括, 汇总, 和对比数据特征, 如, 干旱VS潮湿地区 频繁模式, 关联规则, 相关性 vs
您可能关注的文档
- 改善空调空气品质的措施_7590.doc
- 改性丙烯酸树脂皮革涂饰剂的研究进展.docx
- 改性塑料行业.ppt
- 收集来的一套VI手册模板.ppt
- 收费管理系统设计方案.doc
- 改进喷漆质量降成本QC展示.ppt
- 改进的层次分析法在创业机会评估中的应用.docx
- 改后单向板肋梁楼盖设计10.doc
- 放大电路的设计毕业论文.doc
- 放射卫生监督检查表.doc
- 气象局观测员年度总结PPT课件.pptx
- 12345热线服务中心主任年度工作汇报PPT.pptx
- 2025年版甲型流感诊疗方案解读与实践指南.pptx
- 代理机构上传电子版招标文件操作指南.docx
- 仁爱版七年级下册UNIT8TOPIC3SECTIONC课件14张.ppt
- 考研英语真题及答案详解含答案译文词汇讲解.doc
- 全国10月高等教育自学考试政治经济学财试题和答案00009.doc
- 八年级下UNIT9KeepFit课件模板沪外教版.ppt
- 六年级下英语课件Module10Unit2whatareyougoingtostudy-.ppt
- 六年级下册数学课件-第三单元-圆柱体积的拓展练习-人教版.pptx
最近下载
- DB37_T 4399—2021_养老机构临终关怀服务规范.pdf VIP
- (高清版)B-T 2408-2021 塑料 燃烧性能的测定 水平法和垂直法.pdf VIP
- 中国移动通信企业标准-M2M卡物联卡物联网卡移动物联网卡.PDF
- 模具管理规定(范本01).docx VIP
- (新版)导游资格证考试题库附参考答案(典型题).docx VIP
- 皮肤性病学(山东大)中国大学MOOC慕课 章节测验 客观题答案.docx VIP
- GC级压力管道监控运行工作方案.docx VIP
- 土建单项工程交安验收表.xls VIP
- 征信报告模板-带水印版.docx VIP
- 《平行四边形的判定(第一课时)》教案.docx VIP
原创力文档


文档评论(0)