- 2
- 0
- 约1.06万字
- 约 88页
- 2025-12-30 发布于广东
- 举报
ArtificialIntelligenceApplicationsandPractices芦碧波等人工智能应用与实践第四章AIGC与多媒体
目录行业PPT模板/hangye/01AIGC概述02多媒体创作03AIGC在其他领域的应用
01AIGC概述
AIGC:ArtificialIntelligenceGeneratedContent,人工智能生成内容/生成式人工智能AIGC技术的成熟标志着从文字到图像的跨越式创新,开启了内容创作的新纪元。AIGC的崛起,不仅改变了图像创作的面貌,更对整个多媒体内容生态产生了深远影响,促进了跨媒介内容的无缝融合,使得文字、图像、音频、视频等不同形式的内容能够相互转化,创造出更加丰富、立体、沉浸式的体验。AIGC也是人工智能领域发展最快的技术之一AIGC定义
AIGC发展专业生成内容用户生成内容人工智能生成内容UserGeneratedContent,UGCProfessionalGeneratedContent,PGCArtificialIntelligenceGeneratedContent,AIGC
AIGC的技术基础:基于生成对抗网络、大型预训练模型等人工智能技术狭义AIGC:通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术AIGC能够利用人工智能技术自动生成文本、图片、音频、视频等内容广义的AIGC也包括生成代码等其他方面的内容。AIGC定义
AIGC的发展历程大致可以分为3个阶段:早期萌芽阶段、沉淀积累阶段和快速发展阶段。1.早期萌芽阶段:1950,莱杰伦·希勒(LejarenHiller)和伦纳德·艾萨克森(LeonardIsaacson)通过将计算机程序中的控制变量改为音符,完成了历史上第一部由计算机创作的音乐作品——弦乐四重奏《依利亚克组曲(IlliacSuite)》。1966年,约瑟夫·韦岑鲍姆(JosephWeizenbaum)和肯尼斯·科尔比(KennethColbv)共同开发了世界上第一个机器人“伊莉莎(Eliza)”,其通过关键字扫描和重组来完成交互式任务。80年代中期,IBM基于隐马尔可夫链模型创造了语音控制打字机“坦戈拉(Tangora)”,能够处理两万个单词。AIGC的发展历程
2.沉积积累阶段:1990-2010AIGC从实验性向实用性逐渐转变,深度学习算法、图形处理单元(GPU)、张量处理器(TPU)和训练数据规模等都取得了重大突破,受到算法瓶颈的限制,效果有待提升。2007年,纽约大学人工智能研究员罗斯·古德温(RossGoodwin)装配的人工智能系统通过对公路旅行中的所见所闻进行记录和感知,撰写出世界上第一部完全由人工智能创作的小说《1TheRoad》。2012年,微软公开展示了一个全自动同声传译系统,通过深度神经网络(DNN)可以自动将英文演讲者的内容通过语音识别、语言翻译、语音合成等技术生成中文语音。AIGC的发展历程
3.快速发展阶段:2010-至今深度学习模型不断迭代,AIGC取得突破性进展,尤其在2022年,算法获得井喷式发展,底层技术的突破也使得AIGC商业落地成为可能。其中主要集中在AI绘画领域:2014年6月,生成式对抗网络(GenerativeAdversarialNetwork,GAN)被提出。2021年2月,OpenAI推出了CLIP(ContrastiveLanguage-ImagePre-Training)多模态预训练模型。2022年,扩散模型DiffusionModel逐渐替代GAN,在图像生成和编辑以及视频相关研究领域表现出色,成为大模型应用场景中的主流技术。Suno自成立起就在音乐生成领域独树一帜,其光环加持的创业团队、不断惊艳用户的模型效果、现象级的产品传播方式,反映了用户以及市场对AI音乐方向的关注。AIGC的发展历程
1.多模态大模型的定义多模态大模型是指在一个统一的框架下,集成了多种不同类型数据处理能力的大型神经网络模型,这些模型能够处理图像、文本、音频甚至音频等不同的数据模态,并在这些模态之间进行有效的交互和信息整合。与传统的单模态大模型相比,多模态大模型更加灵活和全面,能够更好地模拟人类对于不同感知模态信息的整合和理解能力。多模态技术的意义在于它能使人工智能系统更接近人类的处理方式,例如,同一信息可以通过文字、语音或图像等多种形式表达,AI系统通过多模态学习就能够理解并关联这些不同的表达形式,提高信息处理的准确性和效率。多模态大模型
2.多模态大模型的优势多模态大模型能够同时处理多种数据模态,
您可能关注的文档
- 人工智能应用与实践教学课件-第5章-智能体开发与应用.pptx
- 人工智能应用与实践教学课件-第7章-人工智能赋能学生发展.pptx
- 人工智能应用与实践教学课件-第3章-大语言模型及其应用.pptx
- 人工智能应用与实践教学课件-第8章-人工智能伦理.pptx
- 人工智能应用与实践教学课件-第6章-人工智能模型与开发.pptx
- 河南省长垣市2025-2026学年八年级上学期期末考试学情自测物理试题-普通用卷.docx
- 2026《雅迪电动车应付账款管理问题及完善对策研究》10000字.doc
- 2026《雅迪电动车应收账款管理完善对策》8200字.doc
- 2026《行业内卷化背景下企业战略转型研究—以顺丰公司为例》16000字.doc
- 2026《雅迪电动车应收账款风险与应对分析》7400字.doc
- 安徽省安庆市潜山市部分学校2025-2026学年七年级下学期阶段学情自测数学试题-普通用卷.docx
- 2026《微型无人机的设计基础综述》2600字.docx
- 安徽六安市金安区2025-2026学年八年级上学期2月期末物理试题-普通用卷.docx
- 2026《五菱汽车公司经营者股权激励实施成效及其启示》9700字.doc
- 北京市第一零九中学2026届高三下学期开学考试数学试题-普通用卷.docx
- 北京海淀实验中学2026届高三下学期数学开学检测试题-普通用卷.docx
- 2026《五菱汽车公司融资模式及融资风险分析》8700字.doc
- 2026《五菱汽车公司物流成本控制研究》文献综述开题报告(含提纲)3800字.doc
- 2026《五菱汽车公司薪酬改革问题研究》开题报告(文献综述)4200字.doc
- 2026《物流企业反内卷的战略转型研究—以顺丰控股为例》13000字.doc
最近下载
- 儿科学(第10版)儿童心肺复苏.pptx VIP
- 《第1课 身边的算法》说课稿教学反思-2023-2024学年小学信息技术浙教版2023五年级上册.docx VIP
- 2025-2026学年浙美版(新教材)小学美术三年级下册(全册)教学设计.docx
- 2025-2026年演出经纪人之演出市场政策与法律法规模拟题库及答案下载.pdf VIP
- 幼儿园教师春季卫生保健知识培训.pptx VIP
- 高速公路旧沥青路面铣刨料再生利用:技术、效益与前景.docx VIP
- 2025-2026学年浙美版(新教材)小学美术三年级下册《运动会奖杯设计》教学设计.docx VIP
- 2024 - 2025人教版(PEP)英语小学二年级下册教学计划 .docx VIP
- 2026年XX施工安全免责协议书.docx VIP
- DLT5300-2013 1000kV 架空输电线路工程施工质量检验及评定规程.docx VIP
原创力文档

文档评论(0)