数据挖掘走入语音处理 - 清华大学.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘走入语音处理 - 清华大学

分 计算机世界 年 月 日 第 版 专题报道 数据挖掘走入语音处理 王玮 蔡莲红 数据挖掘技术 数据挖掘 技术是对数据库采取半自动的方式 寻找特定的模 式 关联规则 变化规律 异常信息等具有统计意义的结构和事件 自 世纪 年代以 ! ! ! ∀ 来 数据挖掘就成为最具活力的研究领域之一 吸引了众多研究者从事这方面的研究 ∀ 数据挖掘方法的特点 数据挖掘方法与统计方法的不同之处主要体现在通常的统计方法是在已有的假设基础 上 从大量的数据中得到验证 而数据挖掘则是从大量的数据中得到崭新的模式 结论和假 ! 设 数据挖掘方法是纯粹的给予数据驱动的方式 而统计方法则更多地引入人为因素并加以 分析 探索式数据分析是统计方法中与数据挖掘最相似的分支 但它所面向的数据集还是比 ∀ 数据挖掘对象小得多∀ 数据挖掘的过程 数据挖掘过程可粗略地分为问题定义 ! 数据准备 和预处理 ! 数据 挖掘以及结果的解释和评估 √∏等阶段∀ 问题定义 在该过程中 数据挖掘人员必须与领域专家及最终用户紧密协作 一方面明 确实际工作对数据挖掘的要求另一方面通过对各种学习算法的对比进而确定可用的学习算 法∀后续的学习算法选择和数据集准备都是在此基础上进行的∀ 数据挖掘 该阶段首先根据对问题的定义明确挖掘的任务或目的 如分类 聚类 关联 ! ! 规则发现或序列模式发现等 之后要决定使用什么样的算法 选择实现算法要考虑两个因素 ∀ ∀ 一是不同的数据有不同的特点 因此 需要用与之相关的算法来挖掘 二是要根据用户或实 际运行系统的要求有的用户可能希望获取描述型的√ ! 容易理 解的知识 采用规则表示的挖掘方法显然要好于神经网络之类的方法 而有的用户只是希 望获取预测准确度尽可能高的预测型 知识 并不在意获取的知识 √ 是否易于理解∀ 结果解释和评估 数据挖掘阶段发现的模式 经过评估 可能存在冗余或无关的模式 这时需要将其剔除 模式也有可能不满足用户要求 这时则需要整个发现过程回退到前续阶 段 如重

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档