数据挖掘2014要点解析.ppt

数据挖掘 南京理工大学计算机学院 徐建 dolphin.xu@ 参考教材 数据挖掘-概念与技术(原书第三版) (加) Jiawei Han Micheline Kamber (著) 范明 等(译) 机械工业出版社 第一章 引论 1、为什么进行数据挖掘 网络之后的下一个技术热点 数据爆炸但知识贫乏 支持数据挖掘技术的基础 从商业数据到商业信息的进化 网络之后的下一个技术热点 网络时代面临的信息问题: 信息过量,难以消化; 信息真假难以辨识; 信息安全难以保证; 信息形式不一致,难以统一处理。 “要学会抛弃信息” 数据爆炸但知识贫乏 数据库的容量已达上万亿水平(T)--1,000,000,000,000个字节,P,Z,E 全球信息量以惊人的速度急剧增长--据估计,每二十个月将增加一倍。 许多组织机构的IT系统中都收集了大量的数据 支持数据挖掘技术的基础 激发了数据挖掘的开发、应用和研究的兴趣的四个主要技术理由: 超大规模数据库的出现,例如商业数据仓库和计算机自动收集的数据记录; 强大的多处理器计算机。例如更快和更大的计算能力和并行体系结构; 海量数据搜索,对巨大量数据的快速访问; 数据挖掘算法。 从商业数据到商业信息的进化 2、数据

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档