- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘及其软件选择的应用
数据挖掘及其软件选择的应用
[摘 要]本文概述了数据挖掘的定义及其软件的分类,对经典的几种数据挖掘软件进行了详细的介绍,提出了企业选择数据挖掘软件的方法,最后通过分析数据挖掘现存的问题,探讨了数据挖掘软件的发展趋势。
[关键词]数据挖掘 数据库 软件应用
作者简介:巩军全(1978-),男,甘肃甘谷人,天水师范学院经济与社会管理学院教师。
一、数据挖掘的涵义
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程[2]。是从信息海洋中提取有价值的知识,从而帮助企业在业务管理及发展上做出及时、正确的判断,然后采取明智的行动,做到在竞争中占据主动权的新途径、新方法。
二、数据挖掘软件
(一)数据挖掘软件分类
一般来讲,数据挖掘软件根据其适用的范围分为两类[3]:专用数据挖掘软件和通用数据挖掘软件。专用数据挖掘软件是针对某个特定领域的问题提供解决方案,在涉及算法的时候充分考虑了数据、需求的特殊性;而通用数据挖掘软件不区分具体数据的含义,采用通用的挖掘算法,处理常见的数据类型。
(二)数据挖掘软件介绍
当前推出的通用数据挖掘软件有三十多种[4],下面分别按:软件产品及其特点、应用行业案例等方面详细介绍经典的SAS、SPSS、Oracle、IBM公司的软件产品,以便对挖掘软件有一个比较深刻的认识。
1.SAS的数挖软件Enterprise Miner
平台:Windows NT
功能:EM为所有的模型开发产生全部的记分代码,这些记分代码能够立即应用到新的数据中。优点:图形化的界面,可视化的操作,可导引即使是数理统计经验不太多的使用者也能按照SEMMA的原则成功的进行数据挖掘。缺点:临时文件花费了许多空间,打印决策树比较困难。
应用行业:多用于一些的零售公司。如美国AutoT是世界上最大的汽车销售站点,每天都会有大量的用户对网站上的信息点击,寻求信息,其运用了SAS软件进行数据挖掘,每天对数据进行分析,找出用户的访问模式,对产品的喜欢程度进行判断,并设特定服务项,取得了巨大的成功。
2.SPSS的数挖软件Clementine
平台:Windows 95, Windows NT.
功能:SPSS是数据清洗、数据挖掘、统计分析工具。优点:界面友好,不需要编程,统计功能强大。缺点:用户很难知道选择存储时存储的是什么信息,即存储输出和存储数据比较容易混淆。应用行业案例:多方位的金融服务商。如美国HSBC银行有多于1.4亿个人银行客户。使用SPSS的数据挖掘工具分析客户,发现模型。三年内增加了15%的销售量,留住了更多的客户,取得很好的效益。
3.Oracle的数挖软件Darwin
平台:Windows NT/95
功能: Darwin支持数据挖掘算法:神经网络,分类和回归树,K-最近邻居、遗传算法、基于记忆的推理(memory-based reasoning)、聚集和贝叶斯算法。优点:第一,高度的可扩展性,由于能够使数据挖掘算法并行实现,所以能够挖掘海量数据;第二,模型能够容易导出,和其他应用集成;第三是Windows风格的客户端易于使用。缺点:缺乏在数据挖掘之前对数据的可视化探索。工作流不能可视化编辑。应用行业:适合专门的数据挖掘和数据仓库市场分析和咨询公司。全球最大的零售商――沃尔玛百货有限公司用Oracle商业智能套件企业加强版在所有经营活动中实现全面的数据智能和分析。
4.IBM的数挖软件Intelligent Miner
平台:Window NT
功能:自动实现数据选择、数据转换、数据发掘和结果呈现这一整套数据挖掘操作。优点:Intelligent Miner可以提供一定程度的定制,具有可扩展性,索引的速度很快,具有先进的语言分析能力、聚集和过滤能力、支持并行处理,查询速度很快。缺点:Intelligent Miner图形界面不友好。元数据不开放,结构复杂。文档缺乏错误代码的详细解释。没有对算法的详细说明。应用行业:Bass Export是世界最大的啤酒进出口商之一,每个星期传送23000份定单,这就需要了解每个客户的习惯,如品牌的喜好等,IM很好的解决了上述问题。
总的来说[5],SAS在数理统计分析、数据挖掘方面具有很大的优势,是熟悉统计学并擅长编程的专业人士的首选。与SAS比较,SPSS则是非统计学专业人士的首选。Oracle在全球数据库领域占有很大的份额,在并行计算方面具有优势。IBM在巨量数据的存储方面具有很强的能力,在数据整合速度、并行处理等方面具有优势。
您可能关注的文档
最近下载
- “新质生产力”系列(五):聚势而飞,低空经济主题投资研究.pptx VIP
- 《GB_T 45526 - 2025北斗_全球卫星导航系统(GNSS)实时动态精密单点定位状态域改正产品规范》最新解读.pptx VIP
- 船舶定位与导航电子海图与电子海图系统1古野FMD3200电子海图使用说明书.pdf
- “新质生产力”系列(四):围绕“五篇大文章”构建投资策略.pdf VIP
- 《园林景观手绘技法表现》教案——项目4园林景观平面图表现技法.docx VIP
- 新质生产力六大主线巡礼.pdf VIP
- “新质生产力”系列(四):围绕“五篇大文章”构建投资策略.docx VIP
- “新质生产力”系列(八):八大新兴产业及九大未来产业巡礼-国信证券-202412.docx VIP
- 乳腺癌的分子分型.pptx VIP
- 新质生产力系列专题(七):科技股盈利提升之路有哪些?.docx VIP
原创力文档


文档评论(0)