- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
;;数据是人工智能的基础,更是大语言模型源源不断的养分来源,作为大模型数据能力链上的重要一环,数据标注受到重要关注,这个环节做得如何,直接决定了大模型有多聪明。;大模型领域的领跑者OpenAI在数据标注上有一套自己的方法,他们的数据标注方式是先做出预训练模型,再用强化学习加上人工反馈来调优,也就是RLHF(从人类反馈中强化学习)。他们找了很多家数据公司来共同完成数据标注,自己组建一个由几十名哲学博士组成的质检团队,对标注好的数据进行检查。数据标注不是以对错来评估,而是给每个问题选出多个匹配的结果,再经过多人多轮的结果排序,直至模型数据符合常人思维,甚至某些专业领域的结果要达到特定要求的知识水平。;;PART01;知识是信息接受者通过对信息的提炼和推理而获得的正确结论,是人对自然世界、人类社会以及思维方式与运动规律的认识与掌握,是人的大脑通过思维重新组合和系统化的信息集合。知识与知识表示是人工智能中的一项重要的基本技术,它决定着人工智能如何进行知识学习。;在信息时代,有许多可以处理和存储大量信息的计算机系统。信息包括数据和事实。数据、事实、信息和知识之间存在着层次关系。最简单的信息片是数据,从数据中,我们可以建立事实,进而获得信息。人们将知识定义为“处理信息以实现智能决策”,这个时代的挑战是将信息转换成知识,使之可以用于智能决策。;从便于表示和运用的角度出发,可将知识分为4种类型。
(1)对象(事实):物理对象和物理概念,反映某一对象或一类对象的属性,例如,桌子结构=高度、宽度、深度。
(2)事件和事件序列(关于过程的知识):时间元素和因果关系。不光有当前状态和行为的描述,还有对其发展的变化及其相关条件、因果关系等描述的知识。;(3)执行(办事、操作行为):不仅包括如何完成(步骤)事情的信息,也包括主导执行的逻辑或算法的信息。如下棋、证明定理、医疗诊断等。
(4)元知识:即知识的知识,关于各种事实的知识,可靠性和相对重要性的知识,关于如何表示知识和运用知识的知识。例如,如果你在考试前一天晚??死记硬背,那么关于这个主题的知识的记忆就不会持续太久。以规则形式表示的元知识称为元规则,用来指导规则的选用。运用元知识进行的推理称为元推理。;这里的知识涵义和我们的一般认识有所区别,它是指以某种结构化方式表示的概念、事件和过程。因此,并不是日常生活中的所有知识都能够得以体现的,只有限定了范围和结构,经过编码改造的知识才能成为人工智能知识表示中的知识。;从数据、事实、信息到知识的层次频谱如下图所示。数据可以是没有附加任何意义或单位的数字,事实是具有单位的数字,信息则是将事实转化为意义。最终,知识是高阶的信息表示和处理,
方便做出复杂的决策和理解。
图4-1数据、事实、信息和知识的分层关系;“知识表示”是指把知识客体中的知识因子与知识关联起来,便于人们识别和理解知识。知识表示是知识组织的前提和基础。下面我们从内涵和外延方法方面进行思考,从而了解表示方法的选择、产生式系统、面向对象等概念。
知识的表示是对知识的一种描述,或者说是对知识的一组约定,一种计算机可以接受的用于描述知识的数据结构,是能够完成对专家的知识进行计算机处理的一系列技术手段。从某种意义上讲,表示可视为数据结构及其处理机制的综合:
表示=数据结构+处理机制;知识表示包含两层含义:
(1)用给定的知识结构,按一定的原则、组织表示知识;
(2)解释所表示知识的含义。;对于人类而言,一个好的知识表示应该具有以下特征:
(1)它应该是透明的,即容易理解。
(2)无论是通过语言、视觉、触觉、声音或者这些组合,都对我们的感官产生影响。
(3)从所表示的世界的真实情况方面考查,它讲述的故事应该让人容易理解。;良好的表示可以充分利用机器庞大的存储器和极快的处理速度,即充分利用其计算能力(具有每秒执行数十亿计算的能力)。知识表示的选择与问题的解理所当然地绑定在一起,以至于可以通过一种表示使问题的约束和挑战变得显而易见(并且得到理解),但是如果使用另一种表示方法,这些约束和挑战就会隐藏起来,使问题变得复杂而难以求解。;一般来说,对于同一种知识可以采用不同的表示方法。反过来,一种知识表示模式可以表达多种不同的知识。但在解决某一问题时,不同的表示方法可能产生不同的效果。人工智能中知识表示方法注重知识的运用,可以粗略地将其分为叙述式表示和过程式表示两大类。;1.叙述式表示法
把知识表示为一个静态的事实集合,并附有处理它们的一些通用程序,即叙述式表示描述事实性知识,给出客观事物所涉及的对象是什么。对于叙述式的知识表示,它的表示与知识运用(推理)是分开处理的。;叙述式表示法易于表示“做什么”,其优点是:
(1)形式简单、采用数据结构表示知识、清晰明确、易于理解、增加了知识的可读性。
(2)模块
文档评论(0)