生成式人工智能基础 课件 第2章 生成式AI与AIGC.pptx

生成式人工智能基础 课件 第2章 生成式AI与AIGC.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;;本章深入探讨了生成式人工智能(生成式AI)与人工智能生成内容(AIGC)的关键概念、技术发展、应用场景以及面临的伦理挑战。通过Blockhead思维实验引出对智能本质的思考,指出LLM虽在文本生成中表现出色,但存在数据污染等问题。接着,回顾了NLP从基于规则的方法到统计方法,再到深度学习方法的演变历程,强调LLM在NLP领域的里程碑意义。;本章中阐述了LLM的定义、核心特征,以及生成式AI与判别式AI的区别,明确了生成式AI的定义、应用场景、未来发展趋势及伦理挑战,并对AIGC进行了定义,探讨了其关键步骤、广泛应用场景以及与生成式AI的紧密联系。在很多语境下,AIGC也被用于指代生成式AI。;此外,本章还分析了生成式AI的层次结构,包括应用层、平台层、模型层和基础设施层,并讨论了AIGC在内容生成领域的具体应用,如内容孪生、内容编辑和内容理解,展示了其在多模态内容生成中的潜力。最后,总结了AIGC在文本、音频、图像、视频、代码生成等多个领域的广泛应用场景,强调其在推动内容创作方式变革中的重要作用。;;PART01;在任何现有或想象中的未来计算机系统中,存储数千个单词的所有可能序列都是不现实的:与之相比,这些序列的数量使得宇宙中的原子数量都看起来是微不足道的。因此,研究人员重新利用神经网络的试验和真实方法,将这些巨大的集合减少到更易管理的形式。

神经网络最初被应用于解决分类问题——决定某物是什么,例如输入一张图片,网络将确定它是狗还是猫的图像。神经网络必须以一种使相关的输入产生相似结果的方式来压缩数据。;1981年,内德·布洛克构建了一个“Blockhead(傻瓜)”假说——假定科学家们通过编程,在Blockhead内预先设定好了近乎所有问题的答案,那么,当它回答问题的时候,人们也许就根本无法区分是Blockhead还是人类在回答问题。显然,这里的Blockhead并不被认为是智能的,因为它回答问题的方式仅仅是从其庞大的记忆知识库中检索并复述,并非通过理解问题之后给出答案。哲学家们一致认为,这样的系统不符合智能的标准。;对于多年来一直在思考AI的哲学家来说,GPT-x(各种版本的GPT软件)就像是一个已经实??了的思维实验。实际上,GPT-x的许多成就就是通过类似的内存检索操作产生的。GPT-x的训练集中包括了数亿个人类个体生成的对话和数以千计的学术出版物,涵盖了潜在的问答对。研究发现,深度神经网络多层结构的设计使其能够有效地从训练数据中检索到正确答案。这表明,GPT-x的回答其实是通过近似甚至是精确复制训练集中的样本生成的。;如果GPT-x真的是以这种方式运行,那么它就只是Blockhead的现实版本。由此,人们在评估LLM时存在一个关键问题:它的训练集中可能包含了评估时使用的测试问题,即“数据污染”,而这些问题应该在评估之前予以排除。

事实上,LLM不仅可以简单地复述其提示的或训练集的大部分内容,它们还能够灵活地融合来自训练集的内容,产生新的输出。许多经验主义哲学家提出,能够灵活复制先前经验中的抽象模式,可能不仅是智能的基础,还是创造力和理性决策的基础。;;NLP(自然语言处理)是一门研究如何让计算机理解、生成和分析人类自然语言的学科,它是AI和计算机科学的重要分支。NLP的发展经历了从基于规则的方法到统计方法,再到深度学习方法的转变。LLM的兴起标志着NLP领域的一个重要里程碑,它们代表了深度学习方法在处理自然语言上的最新进展。;NLP研究的主要内容大致可以分为以下几个方面。随着技术的不断进步,新的研究方向和应用场景也在不断涌现。

(1)文本预处理:这是NLP的基础步骤,包括文本清洗(去除无关字符、标点符号等)、分词(将文本切分成单词或词汇单元)、词性标注(为每个词汇分配语法类别,如名词、动词等)、命名实体识别(识别文本中的特定实体,如人名、地点、组织机构名等)。;(2)词法分析:如何分析词汇的形式和意义,包括词干提取(将词汇还原为其词根形式)、词形还原(将词汇还原为标准词典形式)等。

(3)句法分析:分析句子的结构和组成成分,包括句法树结构的构建、依存关系分析(确定词汇间的语法关系)等。

(4)语义分析:理解文本的深层含义,包括情感分析(判断文本的情感倾向)、主题抽取(识别文本的主题内容)、篇章理解(理解长篇文本的连贯性和逻辑关系)等。;(5)自然语言生成:将非自然语言形式的信息转换成自然语言文本,如自动生成报告、新闻摘要、对话应答等。

(6)机器翻译:将一种自然语言自动转换为另一种自然语言,这是NLP的重要应用之一。

(7)对话系统:构建能够与人类进行自然对话的系统,包括聊天机器人、语音助手等,涉及对话管理、上下文理解、自然语言生成等技术。

(8)信息检索与过滤:从大量文本中找出与查询条件相匹配的信息,如搜索引

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档