- 1、本文档共123页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘项目实中的关键环节
公司介绍 华策辉弘科技有限公司致力于商业数据分析的咨询服务,由具备丰富的国际、国内项目经验的国内外资深专家创办。公司有一支业界不多见的高水准咨询服务专业团队,项目的经验覆盖亚洲太平洋地区包括中国、澳洲、香港、泰国、马来西亚等地的金融业、电讯业以及零售业,为这些不同国家和不同行业的客户提供商业信息及分析性解决方案。 公司介绍 华策辉弘科技有限公司 历史 1997 – 2002, 共同创始人 Eric 工作于SAS中国,Dick工作于SAS香港 2002 – 2004, 独立进行咨询顾问工作 2004 – 2006, Eric在北京创建了华策未来, Dick在香港创建了万讯奥义 2006 – 至今, 在深圳合并,成立了华策辉弘 业务范围 关于决策支持系统/客户关系管理/数据挖掘/信用评分/分析的咨询项目,其主要客户是金融业和通讯行业 基于SAS工具的数据处理和分析的开发服务 提供针对SAS 编程人员/分析师/设计师的培训 团队成员 核心团队成员大都拥有超过八年以上有关各项服务的经验﹐同时具备应用SAS软件八年以上的经验﹐在银行业、电讯业与保险业也有丰富的行业经验, 所担任的角色分别从市场分析及报告到风险评估及管理。团队成员曾经夺得第二届国际智能数据分析比赛冠军。专家团队中有来自英国皇家统计学会的注册统计师。 团队成员在亚太地区及澳大利亚的各行业中的经验 团队成员在亚太地区及澳大利亚的各行业中的经验 电讯行业 中国移动有限公司 中国联通有限公司 澳洲Optus电讯有限公司 香港电讯(PCCW)有限公司 香港和记黄埔有限公司 香港和记环球电讯有限公司 香港数码通移动通讯有限公司 泰国电讯有限公司 泰国AIS电讯有限公司 马来西亚Maxis电讯有限公司 团队成员在亚太地区及澳大利亚的各行业中的经验 保险业 澳洲MBF保险, 澳洲苏黎世保险 零售业 百佳超级市场, 加德士澳洲有限公司 政府部门 香港特别行政区统计处, 香港贸易发展局 中国海关总署 公司介绍 华策辉弘科技有限公司 更多信息: 请访问公司网站 或者与我们联系: +86 755 3336 1183 主题 数据挖掘概述 数据挖掘实施方法论 数据挖掘项目实施流程 专题1:业务目标选定 专题2:数据挖掘项目评估方法 专题3:数据挖掘项目管理 专题4:数据挖掘项目实施中的重要规范 现实世界中的数据挖掘可以用来干什么?—— 搜索制造爆炸的恐怖分子 现实世界中的数据挖掘可以用来干什么?—— 谁会同意扩大军费开支? 就象解谜语一样, 数据挖掘从大量复杂的数据中发现直接有效的信息和知识. 数据分析的最初 数据分析能力受到计算能力和存储能力的限制. 1959年,IBM大型机7090, 0.5 MHz 处理器 0.2 MB内存! 一个600行,4列的数据集需要约3000张打孔卡片! 分析时,一次同时考虑的变量最多达到25个! 促进数据挖掘发展的要素 数据 —— 大量的,运营型数据 用户和需求 ——业务决策支持的需求 技术和方法 —— 计算能力的飞速发展 —— 多学科领域研究的发展 数据 数据洪水已经来临: 大量的数据在产生: 金融、电信以及其它行业的交易数据 科学实验数据:天文、空间探索、生物及高能物理等 Web 数据:文字、图像及其它多媒体格式 拥有16个望远镜的欧洲长基线干扰仪在25天的观察期中每秒钟产生1G数据 2003年,法国电信的呼叫数据为30TB,ATT以26TB的数据量位居第二,如此多的呼叫数据以致于ATT无法全部保存,对数据的分析也只能是“粗略”的 Google,40亿以上的页面(2004年4月统计),数据量为nTB 据加州大学伯克利分校的研究人员统计,2002年新产生数据为1999年的2倍,而且数据的膨胀在不断加速 用户和需求: 对于复杂现象的简单结论 市场 – 谁将会购买这个产品? 预测 – 我们将面临何种需求? 忠诚度 – 谁最有可能流失? 信用 - 哪一类人群不还款的倾向严重? 欺诈 - 什么时候会发生? 用户和需求 技术和方法—— 计算能力的飞速发展 技术和方法—— 多学科领域研究的发展 广泛的商业需求,需要出现一种挖掘数据背后隐藏的知识的手段。 1989年8月在美国底特律召开的第11届国际人工智能联合会议的专题讨论会上首次出现知识发现(KDD)这个术语,数据挖掘(DM)是知识发现(KDD)中的一个特定步骤和核心技术 数据挖掘的研究重点逐渐从发现方法转向系统应用,注重多种发现策略和技术的集成,以及多种学科之间的相互渗透,现在已经成为一个自成体系的应用学科。 什么是数据挖掘?
您可能关注的文档
- 数学思想和数学想方法.ppt
- 数学植树问题例.ppt.ppt
- 数学模型-层次析法的基本步骤.ppt
- 数学有利用人类想的解放.ppt
- 数学游戏一河内(Tower of Hanoi).ppt
- 数学期末·暑假优计划.ppt
- 数学第二轮专题习第一部分专题一函数与议程的思想方法.ppt
- 数学模型-正规与游击战.ppt
- 数学相似三角形性质及其应用(公开课)课件浙教版九年.ppt
- 数学模型1-绪+优选法.ppt
- 《GB/T 32879-2025电动汽车更换用电池箱连接器》.pdf
- 中国国家标准 GB/T 21649.2-2025粒度分析 图像分析法 第2部分: 动态图像分析法.pdf
- 中国国家标准 GB/T 20899.9-2025金矿石化学分析方法 第9部分:碳量的测定.pdf
- 《GB/T 20899.9-2025金矿石化学分析方法 第9部分:碳量的测定》.pdf
- GB/T 20899.9-2025金矿石化学分析方法 第9部分:碳量的测定.pdf
- 《GB/T 33820-2025金属材料 延性试验 多孔状和蜂窝状金属高速压缩试验方法》.pdf
- GB/T 33820-2025金属材料 延性试验 多孔状和蜂窝状金属高速压缩试验方法.pdf
- 中国国家标准 GB/T 33820-2025金属材料 延性试验 多孔状和蜂窝状金属高速压缩试验方法.pdf
- GB/T 45910-2025信息技术 生物特征识别模板保护方案的性能测试.pdf
- 《GB/T 45910-2025信息技术 生物特征识别模板保护方案的性能测试》.pdf
最近下载
- 《成人住院患者静脉血栓栓塞症的预防护理2023版团体标准》解读.pptx
- 开题报告医学PPT模板.pptx VIP
- 2011中考英语作文指导及范文.doc VIP
- 高考英语总复习-第二部分-语法填空专项突破-专题二-无提示词填空-第六讲-并列句和状语从句-市赛课公.pptx VIP
- 工会招聘考试试题及答案.doc VIP
- 河北省中考英语复习指导课件.pptx VIP
- 供应商评级管理办法.docx VIP
- 2025年人教版高一下学期期末考试数学试题与答案解析(共五套) .pdf VIP
- 2025年河北沧州渤海新区黄骅市事业单位公开招聘工作人员130名笔试备考试题及答案解析.docx VIP
- 党纪党规知识测试题及答案_党规知识测试题及答案.doc VIP
文档评论(0)