关于机器学习的讨论 .PDFVIP

下载本文档

134
0
约1.68万字
约 10页
2018-05-27 发布于江苏
举报
版权申诉

关于机器学习的讨论 .PDF

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

关于机器学习的讨论

1 关于机器学习的讨论 * 王珏中国科学院自动化研究所复杂系统与智能科学实验室, 北京 1000 80 1. 1 引言 20 世纪 90 年代初 , 当时的美国副总统提出了一个重要的研究计划——— 国家信息基础设施计划 ( N at ion al Infor m at ion In fra st ruct u re , NI I ) 。在这个计划的推动下, 经过大批科学家与工程师的不懈努力, 我们的生活与工作方式产生了重要的改变。这个计划的技术含义包含了四个方面的内容 : ( 1) 不分时间与地域 , 可以方便地获得信息。 (2 ) 不分时间与地域 , 可以有效地利用信息。 ( 3 ) 不分时间与地域 , 可以有效地利用硬软件资源。 (4 ) 保证信息安全。经过十年的努力, 集计算机科学与技术近四十年的积累, 终于实现了以数字网络与浏览器为核心的技术 , 并做到了“不分时间与地域 , 可以方便地获得信息”。然而 , 其他三个目标 , 特别是“不分时间与地域 , 可以有效地利用信息”的目标远远未能实现。下面这个感叹, 正是我们所面临的现实的写照: E-m a il , 汗流浃背找寻信息的日子一去不复返 , 无纸办公、轻松工作是我们的憧憬 , 然而, 我们失望了, 病毒的侵扰 , 我们提心吊胆 , 垃圾的涌现 , 我们苦不堪言, 我们不安地注视着秘书移动的鼠标 , 打印机吐出淹没我们的纸张, * 本文得到国家重大基础研究项目“数字内容理解的理论与方法 ( 20 04C B318 10 3 ) ”的支持。 2 机器学习及其应用无纸办公成为嘲讽 , 轻松工作成为梦想, 我们开始怀念没有 e- ma il 的时代, 我们开始忧虑进入烦恼的 e- ma il 时代。本文不准备讨论“硬软件有效利用”与“信息安全”的问题 , 而将讨论集中在解决“信息有效利用”的方法之上。“信息有效利用”问题的本质是, 如何根据用户的特定需求从海量数据中建立模型或发现有用的知识。对计算机科学来说, 这就是机器学习。 2001 年 , 美国航空航天局 J P L 实验室的科学家 Mjol sne ss 等人在 S cience 上撰文指出:“每个科学领域的科学过程都有它自己的特点, 但是, 观察、创立假设、根据决定性实验或观察的检验、可理解检验的模型或理论 , 是各学科所共有的。对这个抽象的科学过程的每一个环节 , 机器学习都有相应的发展 , 我们相信它将导致科学方法中从假设生成、模型构造到决定性实验这些所有环节的合适的、部分的自动化。当前的机器学习研究在一些基本论题上正取得令人印象深刻的进展 , 我们预期机器学习研究在今后若干年中将有稳 [ 6 ] 定的进展” 。这个提法是令人惊讶的, 大大超过了机器学习研究者的奢望, 因为他们从未指望在科学研究的整个过程 ( 观察、假设、实验、检验、模型或理论) 中扮演如此重要的角色。计算机科学, 特别是人工智能的研究者一般公认 Simon 对学习的论述 :“如果一个系统能够通过执行某个过程改进它的性能, 这就是学习”。这是一个相当广泛的说明, 其要点是“系统”, 它涵盖了计算系统、控制系统以及人系统等 , 对这些不同系统的学习, 显然属于不同的科学领域。即使计算系统, 由于目标不同, 也分为了“从有限观察概括特定问题世界模型的机器学习”、“发现观测数据中暗含的各种关系的数据分析”, 以及“从观测数据挖掘有用知识的数据挖掘 ”等不同分支。由于这些分支发展的各种方法的共同目标都是 “从大量无序的信息到简洁有序的知识”, 因此 , 它们都可以理解为 Sim on 意义下的“过程 ”, 也就都是“学习”。本文将讨论限制在“从有限观察概括特定问题世界