- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于数据挖掘技术及其应用分析
关于数据挖掘技术及其应用分析
摘 要本文简要介绍了数据挖掘技术的相关方法,并详细阐述了其具体操作流程,再对数据挖掘技术在科研、制造业、金融以及市场营销等领域中的应用情况做了具体分析,以期为相关研究提供部分理论参考意见。
【关键词】数据挖掘 操作流程 应用
数据挖掘(Data Mining)的另一种叫法是Knowledge Discovery in Database,即数据库中的知识发现,通常被简称为KDD。和其他概念所不同的是,数据挖掘指的是一种过程,这一过程的主题是决策和支持。主要是对组织中原有的不完全的、随机的、模糊的大量数据进行分析、归纳和推理,提取出里面的潜在信息和知识,挖掘出一套与之相应的模式,进而为管理人员提供决策支持。
1 数据挖掘技术的相关方法
在实践中,挖掘数据的方法的种类较多,不同的领域或具体情况需要先采取不同的数据挖掘方法。关联规则挖掘、决策树、神经网络方法、粗集方法、遗传算法等都被广泛运用于数据挖掘之中。其中,最常用的方法主要有如下三种。
1.1 决策树方法
该方法是在概念学习系统的基础上建立起来的,其具体操作思路是根据各类不同的特征,以树形结构为标准,找出其中分辨属性能力最强的数据库,再将其划分为各个类似于树的分枝一样的子集,然后再对这些子集进行递归调用处理,直到使每一个子集都能找到同一类型的数据为止。
1.2 神经网络法
大量简单的神经元构成了复杂庞大的神经网络,这些简单的神经元不断进行丰富和完善,连接构成自适应的非线性动态系统,进而发挥其分布、存储、组织、学习以及联想记忆等功能。神经网络法主要通过对人类大脑结构及功能的模拟,再在其训练样本中采用学习算法,进而将在此过程中获取到的知识存储到该网络中的各个神经单元的连接权之中。
1.3 遗传算法
遗传算法和统计学非常相似,其模型的具体形式也是需要预先就进行确定的。在实施算法时,要先进行编码,其编码的对象是将要求解的问题,以此方式产生初始群体。然后再对其个体的适应度进行计算,对染色体进行交换、复制及突变等具体操作,依照“优胜劣汰,适者生存”的原则层层推进,指导找到最佳方案。
2 数据挖掘技术操作过程
数据挖掘技术综合了人工智能、数据库技术以及统计学等相关知识,能够对那些潜藏在数据内部的、新颖的、有效的数据进行更深层次的挖掘,进而将其转化为能够被大众所理解的模式。数据挖掘是一个较为完整的过程,大型数据库中那些未知的、有实用性的有效信息通过这一过程被挖掘出来为广大决策管理者所用。
数据挖掘技术的实施必须有一个有效的环境,在这一环境中,各种数据挖掘工具在此环境中对其有用信息进行挖掘,再通过特定的可视化工具,将这些有用信息转化成能够为用户所理解的信息,进而使其应有的作用得到最大限度发挥。
数据挖掘是一个完整、系统的过程,其具体操作分为如下五个步骤。
2.1 确定业务对象
数据挖掘中最重要的一步是通过对业务问题的定义明确其最终目的。虽然数据挖掘的最终结果无法预测,但这并不代表所探索的问题也无法预见。如果不首先确定业务对象,就会形成为挖掘数据而挖掘数据的错误导向,进而使得整个过程呈现出盲目性状态。
2.2 数据准备
该步骤的主要内容是对数据进行选择、预处理和转换。在对数据进行选择时,一定要选取那些和业务对象紧密相关的各种内外部数据信息。然后再对这些被选取的数据进行分析,确定其具体的挖掘操作类型。最后再将所有所有被分析出来的有效数据转换一个便于分析的模型。
2.3 数据挖掘
在分析被转换过来的分析模型基础上,对其数据进行深层次的挖掘。
2.4 结果分析
对其数据挖掘结果作出解释,并进行评估。该步骤所使用的分析方法是根据数据挖掘的具体操作确定的,通常情况下都会使用到可视化技术。
2.5 知识同化
根据业务信息系统的组织结构,将数据挖掘分析所得到的知识应用到相关的具体实践中去。
3 数据挖掘技术应用领域
3.1 科研领域
科研机构在进行科学研究时,需要对大量的实验调查数据进行分析,科研数据的复杂性极高,传统的用来分析数据的工具已经不再适用。数据挖掘技术的智能化程度较高,可以说其是一种功能极为强大的自动化分析工具,与科研领域对数据分析工具的要求十分吻合,这在一定程度上推动了其在科研领域之中的应用发展。
3.2 金融领域
金融是一个非常特殊的领域,无论是银行还是证券公司,其数据量都非常巨大,具体表现在其交易数据的多样性和存储数据的复杂性之上。近年来,银行每年因信用卡欺诈行为而造成的损失非常之大,使其不得不探索新的方法,以最大限度地减少损失。数据挖掘技术的使用便是近年来银行普遍使用的、用来分析客户信
原创力文档


文档评论(0)