2024年数字经济专题：大国经济体系下_人工智能领航数字经济新阶段.docx

下载文档

2
0
约4.41万字
约 78页
2024-06-13 发布于重庆
举报
版权申诉
保障服务

2024年数字经济专题：大国经济体系下_人工智能领航数字经济新阶段.docx

1、本文档共78页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

2024年数字经济专题：大国经济体系下_人工智能领航数字经济新阶段

一、未来已来，人工智能正式开启第四次工业革命

（一）第四次工业革命概述，融合技术正在掀起历史性的技术浪潮

人工智能是核心技术催化剂，颠覆性技术之间的融合产生协同效应，带来生产力的爆发，成为第四次工业革命的主要推动力。人类文明已经历了三次工业革命，第一次是18世纪中叶以蒸汽机为代表的机械化革命，第二次是19世纪中叶以电力、内燃机为代表的电气化革命，第三次是20世纪中叶以信息技术为代表的自动化革命。当前我们正在进入第四次工业革命—智能化革命，以人工智能（神经网络/下一代云/智能设备）、公有区块链（加密货币/智能合约/数字钱包）、多组学测序（精准治疗/多组分技术/可编程生物学）、储能（自动驾驶/节能电池）和机器人（可复用火箭/自适应机器人/3D打印）为代表的五类颠覆性技术正在融合，融合产生的协同效应将发挥更大作用，推动生产力的发展。其中，人工智能是核心技术催化剂，与其他四类技术的融合范围最广、评分最高。

融合技术带来的实际GDP增速将远超第一次和第二次工业革命，AI对经济增长的贡献突出。据ARK估算，在全球范围内，未来7年的实际GDP增速将达到7%以上，而过去125年的平均增速只有3%。AI作为核心技术催化剂，对经济增长的贡献突出。据ARK估算，引进AI后，实际GDP在2023至2030年间有望累积增长130%。原因是在AI的赋能下，一些行业的生产效率和成本发生了巨大的变化。比如：机器人与AI融合后，可以在非结构化环境中低成本高效地工作，2030年有望带来24万亿美元的经济效益；自动驾驶出租车与生成式AI融合提升了安全性，到2030年有望广泛应用而使每英里成本低至0.25美分，创造一个11万亿美元的潜在市场；而AI软件直接提高了知识型工作者的生产力，2030年有望提升生产力至2.5倍，若软件价值量按10%计算，则有望产生13万亿美元的经济效益。

AGI时代有望加速到来。近期，英伟达创始人CEO黄仁勋和谷歌DeepMindCEO哈萨比斯对AGI的到来时间进行了预测，他们的观点相似。哈萨比斯认为，AGI最早可能在2030年出现，而黄仁勋则认为通用人工智能可能在五年内实现。据ARK分析，根据赖特定律，加速计算硬件的改进将使AI相对计算单元（RCU）的生产成本每年降低53%，而算法模型的增强可以进一步带来每年47%的训练成本下降。换而言之，到2030年，硬件和软件的融合可以使人工智能训练成本以每年75%的速度下降。人工智能模型的训练成本下降将进一步加速其能力的迭代，AGI有望加速到来。

（二）Sora发布标志AGI系统有望超预期提前到来

1．DiTs算法赋能AIGC，Sora开启文生视频新纪元

北京时间2月16日，OpenAI发布“文生视频”大模型Sora。可生成一分钟的高保真视频，并配有48个生成案例及技术报告，能够通过自然语言指令生成长达60秒的高清流畅视频，在生成视频长度、清晰度、连贯性、多镜头切换方面都有显著提升。官方发布的技术报告指出，视频生成模型将是构建“世界通用模拟器”的重要途径。

本质上，Sora基于DiffusionTransformers（DiTs）构建，并使用DALL-E3的重捕获技术。研究表明，DiTs相较于传统语义分割网络架构（U-Net）在模型大小上更具可扩展性，并能生成更高质量的2D及3D图像。

OpenAI曾采用循环网络、生成对抗网络、自回归Transformer和扩散模型等方法对视频数据进行生成建模，但生成视频存在视觉数据受限、视频时长较短或视频尺寸局限等问题。通过从大语言模型（LLM）中汲取灵感，类似GPT将自然语言转换为文本tokens，Sora可将视觉数据转换为patches(视觉编码块)。通过此种方式，即可实现在不同类型的视频和图像上训练生成模型。通过视频压缩网络可降低视觉数据的维度，该网络将原始视频作为输入，并在时间和空间上进行压缩，Sora在压缩空间中接受训练并生成视频；另外，相应的解码器模型可将生成的对象映射回像素空间。Sora基于patches对可变分辨率、持续时间和纵横比的视频和图像进行训练；亦可以通过在适当大小的网格中排列随机初始化的patches来控制生成视频的大小。

2．Sora功能多样化，生成质量远超同类大模型

Sora可以将简短文本描述转换成一分钟流畅视频，相对于Runway、Pika、StableV

2024年数字经济专题：大国经济体系下_人工智能领航数字经济新阶段.docx 原文免费试下载