机器学习在数据挖掘中的应用.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器学习在数据挖掘中的应用.pdf

计算机与信息技术 广西质量监督导报 2008第11期 总第95期 机器学习在数据挖掘中的应用 梁晓音 (广西经济管理干部学院,广西 南宁 530007) 本文的目的是阐述数据挖掘中机器学习的作用。数据挖掘在商业领域得到了广泛的应用,而机器学习可以进行 [摘 要] 数据分析和模式发现,从而在数据挖掘应用中扮演了一个关键的角色。了解各个机器学习技术的优缺点有助于我们在具体的应 用中选择合适的方法。因此,本文对机器学习技术进行了总结和分析,并讨论了它们在数据挖掘中的优缺点。 机器学习;数据挖掘;任务类型 [关键词] 一、引言 二、机器学习的概念与发展 数据挖掘(也称为“数据库中的知识发现”)是数 机器学习是一种使获取知识自动化的计算方法 据库和信息决策领域最前沿的研究方向之一。数据 的学习。机器学习的研究史大致经历了四个阶段: 挖掘能够揭示隐藏的模式和关系。从技术角度来看, 第一个阶段,20世纪50年代的神经模拟和决 数据挖掘是指从数据中提取隐含的,人们事先不知 策理论技术,学习系统在运行时还很少具有结构或 道的,但又是潜在有用的信息和知识的过程。从商业 知识。主要方法是建造神经网络和自组织学习系统, 角度看,数据挖掘是按企业既定的业务目标,对大量 学习表现为阈值逻辑单元传送信号的反馈调整。 的企业数据进行探索和分析,揭示隐藏的、未知的或 第二个阶段,20世纪60年代早期开始研究面 验证已知的规律性,并进一步将其模型化的方法。 向概念的学习,即符号学习。使用的工具是语义网络 MetaGroup曾对数据挖掘做出这样的“全球重评论:或谓词逻辑。在概念获取中,学习系统通过分析相关 要的企业、组织会发现,到21世纪数据挖掘技术将 概念的大量正例和反例来构造概念的符号表示。 是他们商业成功与否的至关重要的影响因素。”数据 第三阶段,开始于20世纪70年代中期,研究活 挖掘是20世纪80年代投资人工智能研究项目失败动日趋兴旺,各种学习方法不断推出,实验系统大量 [2] 后,人工智能转入实际应用时提出的 。它是一个很 涌现,机器学习成为人工智能的一个独立研究领域。 有应用价值的新领域,融合了数据库、人工智能、机 第四阶段,从20世纪80年代中后期到现在,进 器学习、统计学等多个领域的理论和技术。 入到自动化及模式识别等领域,各种学习方法开始 数据挖掘是一个复杂的过程,需要多步迭代。一 继承,多策略学习已经使学习系统愈具应用价值,开 般的数据挖掘过程第一步是分析数据的选择,通常 始从实验室走向应用领域。而运用机器学习的数据 使用合适的历史数据;然后,对数据进行清理和预处 挖掘在商业领域中的应用则是最好的例子。 理,清除数据之间的差异和不一致性;接着,对数据 三、机器学习方法的分类 集进行分析,得到所要的可解释模式并验证模式的 数据挖掘中使用的机器学习技术主要有以下五 一般性,这样才能达到指导商业行为或辅助科学研 [1] 种 。 究的目的。数据挖掘过程可以通过不断地迭代,得到 最终的有意义的知识。 集中产生一棵决策树或一组决策规则来进行分类。 基于机器学习的模式识别算法限制较少,并且 决策树可以转化成一组规则,分类规则通常用析取 产生的模式很容易理解。因此在数据挖掘领域,机器 范式表示。规则归纳主要优点是处理大数据集的能 学习方法以其强大的处理不同类型数据的能力和商 力强,适合分类和预测型的任务,结果易于解释,技 业应用的巨大潜力日益受到该领域学术界和商业界 术上易于实施。 的重视。用于数据挖掘的各种机器学习算法都有各 自的特点,因此了解它们的优缺点将有助于我们在 似人脑神经元的处理节点组成,输入节点通过隐藏 特定的

文档评论(0)

gdkb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档