- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1、数据挖掘的关键词和概念.doc
1、数据挖掘的关键词和概念数据挖掘是从海量数据中提取隐含在其中的有用信息和知识的过程。它可以帮助企业对数据进行微观、中观乃至宏观的统计、分析、综合和推理,从而利用已有数据预测未来,帮助企业赢得竞争优势。例如,利用数据挖掘可以对企业的海量数据进行客户分析,包括客户类型、各类客户的需求倾向、贷款偿还预测和客户信用政策分析、客户流失分析等;进行市场研究,包括商品市场占有率预测、市场拓展计划仿真;进行经营策略研究,包括经营成本与收入分析、风险控制、欺诈行为甄别等。 实现数据挖掘的四个关键 首先,要踏踏实实做好基础数据库的建设。一个企业实现数据挖掘的前提和基础是拥有大量、真实的数据积累。没有数据积累,数据挖掘将无用武之地。 一般用于挖掘的数据有两种来源:数据仓库或数据库。目前,基于数据仓库的数据挖掘逐渐被人们所推崇,它有三点显著优势:一,数据挖掘必须要对数据进行抽取、清洗、转换和装载,这个过程很耗时。如果基于数据仓库,数据仓库已经做好以上工作,就能避免挖掘时每次对数据进行抽取、清洗等。二,数据仓库的数据是按主题组织的,这为数据挖掘选择合适的数据源提供了方便。三,数据库不能存放历史数据,因此直接在数据库中挖掘,许多知识无法挖掘出来,如预测型应用;相反,数据仓库却能。 其次,企业要有比较明确的挖掘目标。盲目的数据挖掘是很难成功的。 再次,数据挖掘必须由来自不同领域的人员共同参与,包括行业专家、数据管理员、数据分析人员、业务分析人员、数据挖掘专家等。大家需要通力合作,寻找一套适合自己企业的开发方法,并逐步建立起挖掘的模型库。 最后,构建数据挖掘系统,不仅需要很高的资金投入,而且挖掘结果是供决策层决策使用的,因此必须得到最高决策管理层的支持、认可和参与数据挖掘(DM)、在线分析(OLAP)和决策支持(DSS)的差异 在在线分处理 OLAP 中,它采用的是演绎推理;在数据挖掘中,则是归纳推理。因此二者的区别是什么及分别采用什么技术差不多是一个问题。数据挖掘(Data Mining)数据挖掘的目标仍然很像是人工智能。数据挖掘用户不能对系统严格地提出一个尽可能完整的问题,以在此模型中发现过去的模式来预测未来的行为。这可以产生以前不知晓的有价值的事实。更开放的数据挖掘请求甚至可以像这样:给我一个人们购买敞蓬卡车时的特点预测模型。通过从过去的模式的学习,数据挖掘系统应能提供下列类型的答案:它取决于时间年份和所在地区。在冬季,在新英格兰乡下的人们,在特定的年龄组和收入水平,将比中西部的同类人,喜欢购买更多的该种卡车。数据挖掘可以发现复杂或精细的答案,而这些是 OLAP 处理所不能做到的。但抛去这些差别,一些不做数据挖掘的 OLAP 销售商也声称他们能做。 Pilot 公司的专家说:给出数据挖掘的较弱的定义,OLAP 销售商说他们可以做数据挖掘。明显的分界线一个是处理是否是自动的,另一个是对诸如什么是感兴趣的和什么是无关的等问题,你是否有一个好的统计基础。在线分析(OLAP)和决策支持(DSS)OLAP 和 DSS 配置有少数的算法,并且依赖于人们提供给问题和假设。这样做的缺点在于问题和假设受限于人的一己之见。一个典型的 OLAP 或 DSS 问题是问:去年中西部的人比新英格兰的人购买了更多的敞蓬卡车吗? 注意这里的问题隐含有某种假设。OLAP 或 DSS 处理将回答:去年中西部的人购买了 12,000 辆卡车,而同一时间, 新英格兰的人买了 10,000 辆。这显然是有帮助的,但这受限于假设。特别查询并生成报表一般用于很多商务活动,来为他们的决策提供输入。决策支持系统 DSS 和执行信息系统 EIS 大多用于这种目的。从基本面来看,需要使用报表生成工具。应用系统利用这些特别的关系数据库系统的查询能力是普遍的现象。数据挖掘帮助人们聚焦于这些系统和技术的使用使用,这样关系信息可以快速获取分析时间更加有效率。分界线的消退。与此同时,数据挖掘、OLAP 和 DSS 的界线正在消退。数据挖掘的算法已经进入了很多产品的议程,包括那些纯粹的 DSS 和 OLAP 销售商,和 ATT 那样,他们已经在悄悄地工作于一个称为最近邻居系统的数据挖掘方案,它可以展示记录间的相似性。因为 DSS 销售商已经有了前卫的数据库可视化系统,如果数据挖掘功能很好地做出,那它的加入是自然而然的事。Data Mining包含哪些主要功能? Data Mining实际应用功能可分为三大类六分项来说明:Classification和Clustering属于分类区隔类;Regression和Time-series属于推算预测类;Association和Sequence则属于序列规则类。 Classification是根据一些变量的数值做
您可能关注的文档
- -140817 澳新11天特惠游 20PAX.doc
- 013年建筑胶水产品监督抽查结果汇总表.doc
- 01月20日招聘信息.doc
- 05-06八年级下期末模拟试题-yyf.doc
- 05月25日招聘信息.doc
- 07年高考政治试题分类汇总(政治常识部分).doc
- 08年上半年学位考试安排表.doc
- 1.2015年度上饶市城镇基本医疗保险定点医疗机构名单-附件1.doc
- 1.4.23.9一次性无菌物品管理制度.doc
- 1.中英文简历模板-es.doc-Name.doc
- 高中语文现代文阅读人工智能辅助学习资源动态更新模式探究教学研究课题报告.docx
- 2025年公共场所情景题库及答案.doc
- 2025年老年文娱设备市场消费行为洞察.docx
- 2025年在线教育个性化学习方案教师培训体系构建报告.docx
- 2025年慢病管理设备市场格局与动态血糖监测仪医保报销现状.docx
- 2026年盐城师范学院辅导员招聘备考题库最新.docx
- 2026年白银希望职业技术学院单招(计算机)考试备考题库最新.docx
- 2026年白银希望职业技术学院单招(计算机)考试备考题库附答案.docx
- 2025年长护险失能老人照护服务创新模式研究.docx
- 《2025年新能源汽车出口报告:斯洛文尼亚市场小型车市场策略》.docx
原创力文档


文档评论(0)