第7章智能信息处理技术.ppt

第7章智能信息处理技术

第7章 智能信息处理技术 第1章 物联网概述 【本章学习重点】   通过本章的学习,了解机器学习、模式识别、信息融合和数据挖掘等各种智能信息处理技术的概念、发展和特点,掌握机器学习、模式识别、信息融合和数据挖掘的系统组成和方法,了解智能信息处理技术的应用,为后续的学习和研究建立基础。 7.1 机器学习 7.1.3 机器学习的主要策略 机器学习进入新阶段的重要表现在下列方面: 机器学习已成为新的边缘学科并在高校形成一门课程。它综合应用心理学、生物学和神经生理学以及数学、自动化和计算机科学形成机器学习理论基础。 结合各种学习方法,取长补短的多种形式的集成学习系统研究正在兴起。特别是连接学习符号学习的耦合,可以更好地解决连续性信号处理中知识与技能的获取与求精问题。 机器学习与人工智能各种基础问题的统一性观点正在形成。例如学习与问题求解结合进行、知识表达便于学习的观点产生了通用智能系统SOAR的组块学习。类比学习与问题求解结合的基于案例方法已成为经验学习的重要方向。 各种学习方法的应用范围不断扩大,一部分已形成商品。与机器学习有关的学术活动空前活跃。国际上除每年一次的机器学习研讨会外,还有计算机学习理论会议以及遗传算法会议。 模型中包含学习系统的四个基本组成环节。环境和知识库是以某种知识表示形式表达的信息的集合,分别代表外界信息来源和系统具有的知识。学习环节和执行环节代表两个过程。学习环节处理环境提供的信息,以便改善知识库中的显式知识。执行环节利用知识库中的知识来完成某种任务,并把执行中获得的信息回送给学习环节。 环境向系统的学习部分提供某些信息,学习部分利用这些信息修改知识库,以增进系统执行部分完成任务的效能,执行部分根据知识库完成任务,同时把获得的信息反馈给学习部分。在具体的应用中,环境、知识库和执行部分决定了具体的工作内容,学习部分所需要解决的问题完全由上述三部分确定。 影响学习系统设计的最重要的因素是环境向系统提供的信息,更具体地说是信息的质量。知识库里存放的是指导执行部分动作的一般原则,但环境向学习系统提供的信息却是各种各样的。如果信息的质量比较高,与一般原则的差别比较小,则学习部分比较容易处理。如果向学习系统提供的是杂乱无章的、指导执行具体动作的具体信息,则学习系统需要在获得足够数据之后,删除不必要的细节,进行总结推广,形成指导动作的一般原则,放入知识库,这样学习部分的任务就比较繁重,设计起来也较为困难。 信息的水平是指信息的一般性程度,也就是适用范围的广泛性。这里的一般性程度是相对执行环节的要求而言。高水平信息比较抽象,适用于更广泛的问题。低水平信息比较具体,只适用于个别的问题。环境提供的信息水平和执行环节所需的信息水平之间往往有差距,学习环节的任务就是解决水平差距问题。 如果环境提供较抽象的高水平信息,学习环节就要补充遗漏的细节,以便执行环节能用于具体情况。如果环境提供较具体的低水平信息,即在特殊情况执行任务的实例,学习环境就要由此归纳出规则,以便用于完成更广的任务。   信息的质量是指:正确性、适当的选择和合理的组织。 信息质量对学习难度有明显的影响。例如,若施教者向系统提供准确的实教例子,而且提供例子的次序也有利于学习,则容易进行归纳。若实教例子中有干扰,或实例的次序不合理,则难以归纳。 知识库是影响学习系统设计的第二个因素。知识的表示有多种形式,比如特征向量、一阶逻辑语句、产生式规则、语义网络和框架等等,这些表示方式各有其特点。在选择表示方式时要兼顾以下4个方面: 执行部分是整个学习系统的核心,因为执行部分的动作就是学习部分力求改进的动作。同执行部分有关的问题有三个:复杂性、反馈和透明性。 任务的复杂性。对于通过例子学习的系统,任务的复杂性可以分成三类。最简单的是按照单一的概念或规则进行分类或预测的任务。比较复杂一点的任务涉及多个概念。学习系统最复杂的任务是小型计划任务,系统必须给出一组规则序列,执行部分依次执行这些规则。 反馈。所有的学习系统必须评价学习部分提出的假设。有些程序有一部分独立的知识专门从事这种评价。最常用的方法是有教师提出的外部执行标准,然后,观察比较执行结果与这个标准,视情况把比较结果反馈给学习部分,以决定假设的取舍。 透明性。透明性要求从系统的执行部分的动作效果可以很容易地对知识库的规则进行评价。 机器学习的发展极为迅速,应用亦日益广泛,有很多优秀的学习算法,可以分为基于符号学习方法和基于非符号学习方法。 其中符号学习比较好的有机械式学习、指导式学习、示例学习、类比学习、基于解释的学习。 随着人工智能研究的进展,人们逐渐发现研究人工智能的最好方法是向人类自身学习,因而引入

文档评论(0)

1亿VIP精品文档

相关文档