- 1、本文档共78页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
2024年数字经济专题:大国经济体系下_人工智能领航数字经济新阶段
一、未来已来,人工智能正式开启第四次工业革命
(一)第四次工业革命概述,融合技术正在掀起历史性的技术浪潮
人工智能是核心技术催化剂,颠覆性技术之间的融合产生协同效应,带来生产力的爆发,成为第四次工业革命的主要推动力。人类文明已经历了三次工业革命,第一次是18世纪中叶以蒸汽机为代表的机械化革命,第二次是19世纪中叶以电力、内燃机为代表的电气化革命,第三次是20世纪中叶以信息技术为代表的自动化革命。当前我们正在进入第四次工业革命—智能化革命,以人工智能(神经网络/下一代云/智能设备)、公有区块链(加密货币/智能合约/数字钱包)、多组学测序(精准治疗/多组分技术/可编程生物学)、储能(自动驾驶/节能电池)和机器人(可复用火箭/自适应机器人/3D打印)为代表的五类颠覆性技术正在融合,融合产生的协同效应将发挥更大作用,推动生产力的发展。其中,人工智能是核心技术催化剂,与其他四类技术的融合范围最广、评分最高。
融合技术带来的实际GDP增速将远超第一次和第二次工业革命,AI对经济增长的贡献突出。据ARK估算,在全球范围内,未来7年的实际GDP增速将达到7%以上,而过去125年的平均增速只有3%。AI作为核心技术催化剂,对经济增长的贡献突出。据ARK估算,引进AI后,实际GDP在2023至2030年间有望累积增长130%。原因是在AI的赋能下,一些行业的生产效率和成本发生了巨大的变化。比如:机器人与AI融合后,可以在非结构化环境中低成本高效地工作,2030年有望带来24万亿美元的经济效益;自动驾驶出租车与生成式AI融合提升了安全性,到2030年有望广泛应用而使每英里成本低至0.25美分,创造一个11万亿美元的潜在市场;而AI软件直接提高了知识型工作者的生产力,2030年有望提升生产力至2.5倍,若软件价值量按10%计算,则有望产生13万亿美元的经济效益。
AGI时代有望加速到来。近期,英伟达创始人CEO黄仁勋和谷歌DeepMindCEO哈萨比斯对AGI的到来时间进行了预测,他们的观点相似。哈萨比斯认为,AGI最早可能在2030年出现,而黄仁勋则认为通用人工智能可能在五年内实现。据ARK分析,根据赖特定律,加速计算硬件的改进将使AI相对计算单元(RCU)的生产成本每年降低53%,而算法模型的增强可以进一步带来每年47%的训练成本下降。换而言之,到2030年,硬件和软件的融合可以使人工智能训练成本以每年75%的速度下降。人工智能模型的训练成本下降将进一步加速其能力的迭代,AGI有望加速到来。
(二)Sora发布标志AGI系统有望超预期提前到来
1.DiTs算法赋能AIGC,Sora开启文生视频新纪元
北京时间2月16日,OpenAI发布“文生视频”大模型Sora。可生成一分钟的高保真视频,并配有48个生成案例及技术报告,能够通过自然语言指令生成长达60秒的高清流畅视频,在生成视频长度、清晰度、连贯性、多镜头切换方面都有显著提升。官方发布的技术报告指出,视频生成模型将是构建“世界通用模拟器”的重要途径。
本质上,Sora基于DiffusionTransformers(DiTs)构建,并使用DALL-E3的重捕获技术。研究表明,DiTs相较于传统语义分割网络架构(U-Net)在模型大小上更具可扩展性,并能生成更高质量的2D及3D图像。
OpenAI曾采用循环网络、生成对抗网络、自回归Transformer和扩散模型等方法对视频数据进行生成建模,但生成视频存在视觉数据受限、视频时长较短或视频尺寸局限等问题。通过从大语言模型(LLM)中汲取灵感,类似GPT将自然语言转换为文本tokens,Sora可将视觉数据转换为patches(视觉编码块)。通过此种方式,即可实现在不同类型的视频和图像上训练生成模型。通过视频压缩网络可降低视觉数据的维度,该网络将原始视频作为输入,并在时间和空间上进行压缩,Sora在压缩空间中接受训练并生成视频;另外,相应的解码器模型可将生成的对象映射回像素空间。Sora基于patches对可变分辨率、持续时间和纵横比的视频和图像进行训练;亦可以通过在适当大小的网格中排列随机初始化的patches来控制生成视频的大小。
2.Sora功能多样化,生成质量远超同类大模型
Sora可以将简短文本描述转换成一分钟流畅视频,相对于Runway、Pika、StableV
您可能关注的文档
- 2024年深耕江浙报告:浙江省_制造强省_走高质量发展之路.docx
- 2024年十八届三中全会之后的中国经济变革(二):牛市的宏观条件_十年资本市场复盘.docx
- 2024年数字经济产业链分析之河南概况.docx
- 2024年数字经济专题:把握数字化机遇_赋能跨越式发展.docx
- 2024年数字经济专题:跨境电商物流迎新发展机遇_数字货运具备广阔发展空间.docx
- 2024年数字经济专题:人工智能行业应用如火如荼_数字经济算力基建再接再砺.docx
- 2024年数字经济专题:人工智能与数字经济驱动医药产业升级.docx
- 2024年数字经济专题:数字低空赋能_抢滩低空经济万亿级蓝海市场.docx
- 2024年数字经济专题:数字化助力食品饮料企业降本增效.docx
- 2024年数字经济专题:数字经济下的贸易变革_把握数字贸易高质量发展机遇.docx
文档评论(0)