人工智能行业:DeepSeek应用与部署.pptx

听听真我数字人讲DeepSeek

AIGC发展历程

自然语言处理与语言模型

DeepSeek介绍

DeepSeek:2023—

DeepSeek:技术创新——模型架构|V2

(Multi-HeadLatentAttention)

DeepSeek:技术创新—模型架构|V3

DeepSeek:技术创新—推理模型|RL

PPO:ProximalPolicyOptimization

GRPO:GroupRelativePolicyOptimization

强化学习让智能体(Agent)在环境

(Environment)中不断尝试、学习,并优化自己的策

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档