- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.5.2 机器学习的地位和作用 机器学习是AI的核心研究内容 已成为整个计算机领域中最活跃、应用潜力最明显的领域之一 美国航空航天局JPL实验室的科学家们在2001年9月出版的《Science》上撰文指出:“机器学习对科学研究的整个过程正起到越来越大的支持作用,……,该领域在今后的若干年内将取得稳定而快速的发展。” 机器学习研究的热门程度还可以从该领域的国际权威期刊Journal of Machine Learning Research的影响因子看出,据美国科学引文检索公司(ISI)统计,2004年该学报的影响因子已达到5.952,是整个计算机领域影响因子最高的期刊之一。 * 第六十二页,共一百一十二页。 机器学习的地位和作用(续) 主要应用领域 数据挖掘 语音识别 图像识别 机器人 车辆自动驾驶 生物信息学 信息安全 遥感信息处理 计算金融学 工业过程控制 …… 涉及的主要学科 人工智能 模式识别 概率统计 神经生物学 认知科学 信息论 控制论 计算复杂性理论 哲学 …… * 第六十三页,共一百一十二页。 19世纪末,James发现了神经元是相互连接的现象 20世纪30年代,McCulloch和Pitts发现了神经元的“兴奋”和“抑制”机制 20世纪中叶,Hebb发现了“学习律” 机器学习的发展大致可分为两条重要主线 2.5.3 机器学习的发展历程 * 第六十四页,共一百一十二页。 主线一:以Barlow提出的功能单细胞假设为依据 1956年,Rosenblatt提出了感知器 随后近30年,Samuel等人提出的“符号机器学习”方法一直处于主导地位 1969年,Minsky开始研究线性不可分问题 1986年,Rumelhart提出了著名的后向传播(BP)神经网络 20世纪90年代,Vapnik等人提出了针对有限样本的统计学习理论(SLT)和支持向量机(SVM) 机器学习的发展主线一 * 第六十五页,共一百一十二页。 主线二:以Hebb提出的神经集合体假设为依据 1960年,Widrow提出了Madline以解决平凡解问题 1984年,Valiant提出了PAC 1990年,Schapire提出了弱学习定理 1995年,Freund和Schapire提出了AdaBoost算法 在上述研究成果的基础上,逐渐形成了泛化理论 1967年,哥德尔从数学上证明了符号机器学习是不可能完全实现的 …… 机器学习的发展主线二 * 第六十六页,共一百一十二页。 泛化能力(Generalization) 越准越好:永远追求的目标之一 支持向量机(SVM)、集成学习(Ensemble learning) 速度 越快越好:永远追求的目标之一 训练速度、测试速度 可理解性 现实中需要向用户解释——Why? 如:医疗诊断中需向用户解释“为何做出这个诊断?” 目前功能强大的机器学习方法(NN, SVM 等)绝大多数是“黑盒子” 2.5.4 机器学习中的五个挑战性问题 * 第六十七页,共一百一十二页。 数据利用能力 如何处理现实中绝大多数“未标记”数据? 如何处理含噪声、属性缺失、不一致的“坏”数据? 如何处理大量分布“不平衡”数据? 代价敏感(Cost-sensitive) 不同应用领域所能容忍的错误代价不一样 同一应用领域中不同判断所对应的代价也不一样 期望以较小的代价达到“趣利避害”的目的 典型评价方法:ROC (Receiver Operating Characteristics) 机器学习中的五个挑战性问题(续) * 第六十八页,共一百一十二页。 2.5.5 机器学习中的主要理论问题 统计类机器学习需要满足独立同分布条件,该要求太过苛刻 没有一般的指导原则来寻找问题线性表示的空间 没有好的方法来支持信息向符号的映射 机器学习没有一劳永逸的解决方案 领域知识与数据分析不可避免 * 第六十九页,共一百一十二页。 2.5.6 机器学习的发展趋势 主方向的改变 不再单独做“会学习的机器(人)” 越来越朝着“智能数据分析”的方向发展 已成为智能数据分析的支撑技术 侧重点的改变 传统ML强调“学习本身是目的” 当前ML强调“学习本身是手段” 新的机器学习方法不断涌现 流形学习、增强学习、多示例学习、半监督学习、Ranking学习、数据流学习…… * 第七十页,共一百一十二页。 2.6 几种重要的机器学习方法 统计学习理论与支持向量机 统计学习理论(SLT) 支持向量机(SVM) 隐马尔可夫模型(HMM) 贝叶斯网络(Bayesian Network) …… * 第七十一页,共一百一十二页。 2.6.1 统计学习理论与支持向量机 SLTSVM的地位与作用 SL
您可能关注的文档
- 招聘肯德基密不外传的招聘技巧培训.ppt
- 招聘培训-副本.ppt
- 招聘渠道的选择与拓展培训课件.ppt
- 招聘与面试技术.ppt
- 招聘与选拔培训资料.ppt
- 招商策略与策划相关问题的探讨.ppt
- 招商经理谈判技能培训讲义.ppt
- 招商经理谈判技巧培训.ppt
- 招商设计思路实例.ppt
- 招商实施方案及培训.ppt
- 2025年无人机低空医疗物资投放社会效益报告.docx
- 2025年再生塑料行业包装回收利用产业链重构研究.docx
- 《AI眼镜周边产品市场机遇:2025年终端销售与需求增长洞察》.docx
- 2025年坚果加工行业深加工技术突破与市场拓展策略报告.docx
- 2025年通信芯片行业技术竞争与未来趋势报告.docx
- 《2025年生鲜电商配送冷链事故分析与预防措施》.docx
- 《商业航天融资新趋势2025民营卫星企业资本涌入估值分析市场动态》.docx
- 2025年能源绿色健康行业创新技术与市场应用报告.docx
- 2025年无人机低空医疗救援通信方案分析报告.docx
- 2025年烹饪机器人行业市场集中度分析报告.docx
原创力文档


文档评论(0)