- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD)
数据挖掘概述
数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前 HYPERLINK /wiki/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD \o 人工智能 人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
数据挖掘的定义
1.技术上的定义及含义
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。
与数据挖掘相近的同义词有 HYPERLINK /w/index.php?title=%E6%95%B0%E6%8D%AE%E8%9E%8D%E5%90%88action=edit \o 数据融合 数据融合、 HYPERLINK /wiki/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD \o 人工智能 人工智能、 HYPERLINK /wiki/%E5%95%86%E5%8A%A1%E6%99%BA%E8%83%BD \o 商务智能 商务智能、 HYPERLINK /w/index.php?title=%E6%A8%A1%E5%BC%8F%E8%AF%86%E5%88%ABaction=edit \o 模式识别 模式识别、 HYPERLINK /w/index.php?title=%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0action=edit \o 机器学习 机器学习、 HYPERLINK /wiki/%E7%9F%A5%E8%AF%86%E5%8F%91%E7%8E%B0 \o 知识发现 知识发现、 HYPERLINK /wiki/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90 \o 数据分析 数据分析和 HYPERLINK /w/index.php?title=%E5%86%B3%E7%AD%96%E6%94%AF%E6%8C%81action=edit \o 决策支持 决策支持等。
----何为知识?从广义上理解,数据、信息也是知识的表现形式,但是人们更把概念、规则、模式、规律和约束等看作知识。人们把数据看作是形成知识的源泉,好像从矿石中采矿或淘金一样。原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于 HYPERLINK /wiki/%E4%BF%A1%E6%81%AF%E7%AE%A1%E7%90%86 \o 信息管理 信息管理,查询优化,决策支持和 HYPERLINK /wiki/%E8%BF%87%E7%A8%8B%E6%8E%A7%E5%88%B6 \o 过程控制 过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门 HYPERLINK /wiki/%E4%BA%A4%E5%8F%89%E5%AD%A6%E7%A7%91 \o 交叉学科 交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、 HYPERLINK /wiki/%E6%95%B0%E7%90%86%E7%BB%9F%E8%AE%A1 \o 数理统计 数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到数据挖掘这一新兴的研究领域,形成新的技术热点。
这里所说的知识发现,不是要求发现放之四海而皆准的真理,也不是要去发现崭新的自然科学定理和纯数学公式,更不是什么机器定理证明。实际上,所有发现的知识都是相对的,是有特定前提和约束条件,面向特定领域的,同时还要能够易于被用户理解。最好能用自然语言表达所发现的结果。
原创力文档


文档评论(0)