商务智能与决策支持绪论.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 山东大学管理学院 三、数据挖掘概述 2、数据挖掘的定义 技术上的定义:数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 - 原始数据可以是结构化的;也可以是半结构化的。 - 数据源必须是真实的、大量的、含噪声的; - 发现的是用户感兴趣的知识; - 发现的知识要可接受、可理解、可应用; - 并不要求发现放之四海而皆准的普遍规律,仅支持特定的发现问题。 第六十二页,共一百零六页。 * 山东大学管理学院 三、数据挖掘概述 结构化数据:存储在数据库里,可以用二维表结构来逻辑表达实现的数据叫结构化数据 。 非结构化数据:不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档、文本、图片、Web页、各类报表、图像和音频/视频信息等等。 半结构化数据:介于两者之间,具有隐含模式、信息结构不规则、无严格类型约束等特点。字段可根据需要扩充,即字段数目不定,例如Exchange存储的数据。 第六十三页,共一百零六页。 * 山东大学管理学院 三、数据挖掘概述 2、数据挖掘的定义 商业角度的定义:数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中得到辅助商业决策的关键数据。 企业数据量非常大,而其中真正有价值的信息却很少,因此从大量的数据中经过深层分析,获得有利于商业运作、提高竞争力的信息,就像从矿石中淘金一样,数据挖掘也因此而得名。 第六十四页,共一百零六页。 * 山东大学管理学院 三、数据挖掘概述 2、数据挖掘的定义 数据挖掘与传统分析方法的区别 数据挖掘与传统分析方法(如查询、报表、联机应用分析等)的本质区别是: 数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先前未知、有效和可实用三个特征。 第六十五页,共一百零六页。 * 山东大学管理学院 三、数据挖掘概述 3、数据挖掘与知识发现 与数据挖掘相近的词有知识发现、数据融合、数据分析和决策支持等。 第六十六页,共一百零六页。 * 山东大学管理学院 三、数据挖掘概述 第六十七页,共一百零六页。 * 山东大学管理学院 三、数据挖掘概述 4、在何种数据上进行数据挖掘 - 空间数据库 空间数据库是指在关系型数据库(DBMS)内部对地理信息进行物理存储。空间数据库中存储的海量数据包括对象的空间拓扑特征、非空间属性特征以及对象在时间上的状态变化。 常见的空间数据库数据类型 地理信息系统(GIS) 遥感图像数据 医学图像数据 数据挖掘技术的应用:通过空间分类和空间趋势分析,引入机器学习算法,对有用模式进行智能检索 第六十八页,共一百零六页。 * 山东大学管理学院 三、数据挖掘概述 4、在何种数据上进行数据挖掘 - 时间数据库和时间序列数据库 时间数据库和时序数据库都存放与时间有关的数据。时间数据库通常存放包含时间相关属性的数据。时序数据库存放随时间变化的值序列。 对时间数据库和时序数据库的数据挖掘,可以通过研究事物发生发展的过程,有助于揭示事物发展的本质规律,可以发现数据对象的演变特征或对象变化趋势。 第六十九页,共一百零六页。 * 山东大学管理学院 三、数据挖掘概述 4、在何种数据上进行数据挖掘 - 流数据 与传统的数据库技术中的静态数据不同,流数据是连续的、有序的、变化的、快速的、大量的数据输入的数据。 主要应用场合 网络监控 网页点击流 股票市场 流媒体…等等 与传统数据库技术相比,流数据在存储、查询、访问、实时性的要求等方面都有很大区别。 第七十页,共一百零六页。 * 山东大学管理学院 三、数据挖掘概述 4、在何种数据上进行数据挖掘 - 多媒体数据库 多媒体数据库实现用计算机管理庞大复杂的多媒体数据,主要包括包括图形(graphics)、图象(image)、声音(audio)、视频(video)等等,现代数据库技术一般将这些多媒体数据以二进制大对象的形式进行存储。 对于多媒体数据库的数据挖掘,需要将存储和检索技术相结合。目前的主要方法包括构造多媒体数据立方体、多媒体数据库的多特征提取和基于相似性的模式匹配。 第七十一页,共一百零六页。 * 山东大学管理学院 三、数据挖掘概述 4、在何种数据上进行数据挖掘 - 面向对象数据库和对象-关系数据库 面向对象数据库是面向对象技术和数据库技术结合的产物,该技术对数据以对象的形式进行

文档评论(0)

虾虾教育 + 关注
官方认证
文档贡献者

有问题请私信!谢谢啦 资料均为网络收集与整理,收费仅为整理费用,如有侵权,请私信,立马删除

版权声明书
用户编号:8012026075000021
认证主体重庆皮皮猪科技有限公司
IP属地重庆
统一社会信用代码/组织机构代码
91500113MA61PRPQ02

1亿VIP精品文档

相关文档