- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
深入探析机器学习与数据挖掘
机器学习与数据挖掘 基本问题 何为机器学习、数据挖掘? 计算机的功能 替代人的大脑进行思维 最简单的:+-*/…… 稍复杂:圆、方、直线…… 按规则推理 传统的人工智能 更复杂的思维能力? 学习、综合、推广、创新…… ?用计算机全面替代人的大脑进行思维是计算机学界的终极理想 何为机器学习、数据挖掘? 计算机的功能 计算机“思维”水平的现状 人类已深刻理解的过程 使用准确的数学模型进行计算 各种运算:+ - * / sin log…… 边缘提取:各种算子 几何形状提取:Hough 变换 何为机器学习、数据挖掘? 计算机的功能 计算机“思维”水平的现状 人类尚未深刻理解的过程? 尚未有好的办法解决 人类是如何解决的? ?学习 ?如果计算机可如人类一样学习,则可极大提高计算机应用范围和效果 机器学习 何为机器学习、数据挖掘? 何为“学习”? H. Simon: Any process by which a system improves its performance M. Minsky: Learning is making useful changes in our minds R. Michalsky: Learning is constructing or modifying representations of what is being experienced L. Valiant: Learning is the process of knowledge acquisition in the absence of explicit programming …… 何为机器学习、数据挖掘? 学习的基本模型 人类是如何学习的? 基本过程:观察?响应 何为机器学习、数据挖掘? 学习的基本模型 人类是如何学习的? 学习过程的本质是对因果律求逆 何为机器学习、数据挖掘? 学习的基本模型 何为机器学习、数据挖掘? 学习的基本模型 基本要素 问题:所需要的输出(类别、数值…) 特征/属性:可观测的物理量 样本:特征组合和输出类别的一些对应关系 何为机器学习、数据挖掘? 学习的基本模型 目标 通过对少量样本的分析,获得一个特征和输出类别的一般性对应关系 ?基本数学模型 强:给定一组{(X, F(X))},求F 如不对F进行很强的限制,一般难以实现 弱:给定一组{(X, F(X))},对新的X,求F(X) “举一反三” 仍然是很难的问题 何为机器学习、数据挖掘? 学习的基本模型 应用过程 机器学习与数据挖掘研究内容 样本准备 对象分割 对象在文档中可能只占很小比例 用整个文档提取的特征含有大量噪声 特征与特征提取 使用什么样的特征?如何计算?如何进行预处理? …… 样本选择 正负样本数可能严重失衡(1:10,1:100) 样本可能包含噪声 机器学习与数据挖掘研究内容 样本预处理 特征选择 并非所有特征都对学习有帮助 过多的特征会带来大量噪声 特征降维 消除特征之间的相关性,降低特征维数 过多的特征会带来大量噪声 机器学习与数据挖掘研究内容 训练算法 算法选择 概率的/几何的? 产生式/区分式? …… 参数选择 算法参数的选择直接决定了训练出的模型的优劣 Boost 是否需要Boost? 用哪种Boost方法? * * y=ax+b X Y A B a b 峰值 热 红色 跳动 …… 火 火 内在实体:不可直接观测 因果律 热 红色 跳动 可观测特征 学习 意识中的实体 概念空间 特征空间 因果律 物理过程 学习过程 原始数据 人工分析 机器学习 训练样本 模型 新数据 结果 离线过程 在线过程 数学方法 决定性步骤 尚无有效的理论指导 *
您可能关注的文档
- 广告创意分赛要求及综合汇编.doc
- 广州云化信息科技有限公司简介和招聘信息及综合汇编.doc
- 广州公共资源交易中心投标保证金管理系统投标人使用手册及综合汇编.doc
- 广州六中2015届高三上学期第三次质量检测及综合汇编.doc
- 广州国际商品展贸城—国际汽车展览交易中心及综合汇编.doc
- 广州公共资源交易中心电子开评标系统及综合汇编.doc
- 广州地铁珠江新城旅客自动输送系统(APM)及综合汇编.doc
- 广州地铁2014年信息化基础架构平台建设项目(重新招标)招及综合汇编.doc
- 广州城市职业学院办公手机集群网通信方案及综合汇编.doc
- 广州地铁非强制检定计量器具检测服务项目【2012-0341】及综合汇编.doc
最近下载
- 人教版(PEP)小学六年级英语上册第四单元Unit 4 A Let’s talk精品课件.pptx VIP
- 2025中级保育师资格考试题库资料及答案(浓缩400题).pdf VIP
- 革命圣地西柏坡七言诗句.docx VIP
- (必会)中级保育师资格近年考试真题题库汇总(300题).docx VIP
- FSSC22000 V6食品安全管理体系管理手册 .pdf VIP
- 建筑工程图集 16J914-1:公用建筑卫生间.pdf VIP
- 外研版(2021)中职英语基础模块1 Unit 5 We Have Only One Earth For Better Performance 教案.docx VIP
- 07J912-1变配电所图集.pdf VIP
- 耳鼻咽喉科专科护士授权理论考试试题.docx VIP
- 工程项目保修期的工作安排措施.doc VIP
文档评论(0)