- 35
- 0
- 约8.68千字
- 约 11页
- 2025-02-14 发布于广西
- 举报
目 录
TOC\o1-2\h\z\u一、DeepSeek发布多款AI模型,性能行业领先且价格优势显著 4
(一)DeepSeek-V3性能比肩GPT-4o等主流开源及闭源模型 5
(二)DeepSeek-R1性能对标OpenAIo1正式版 6
(三)首个多模态大模型Janus-Pro在文字转图像性能上比肩DALL-E3等主流多模态模型 8
二、DeepSeek-V3从训练技术、训练框架等方向进行了优化,降低训练成本 9
图表目录
图表1 DeepSeek发展历程及模型发布 4
图表2 DeepSeek-V3性能比肩GPT-4o等主流开源及闭源模型 5
图表3 DeepSeek-V3性能与主流开源及闭源模型对比 6
图表4 DeepSeek-R1性能对标OpenAIo1正式版 7
图表5 DeepSeek-R1蒸馏小模型超越OpenAIo1-mini 7
图表6 Janus-Pro增强了文本到图像生成的稳定性 8
图表7 DeepSeek-R1API服务定价显著低于OpenAIo1 9
图表8 DeepSeek-V3训练成本(假设H800的租赁价格为$2/GPU小时) 9
图表9 硅基流动×华为云上线基于昇腾云的DeepSeekR1V3推理服务 10
图表10 英伟达、微软、亚马逊等AI巨头纷纷宣布已接入DeepSeek 11
一、DeepSeek发布多款AI模型,性能行业领先且价格优势显著
近期DeepSeek发布多款AI模型,涵盖语言及多模态不同类型,性能表现行业领先。深度求索(DeepSeek)为中国一家人工智能与大型语言模型公司,总部位于中国大陆浙江省杭州市,由中资对冲基金幻方量化创立。2024年12月26日,DeepSeek发布并开源了DeepSeek-V3,评测成绩超越Qwen2.5-72B(阿里自研大模型)和LLaMA3.1-405B(Meta自研大模型)等开源模型,能与GPT-4o、Claude3.5-Sonnet(Anthropic自研大模型)等闭源模型相抗衡。2025年1月20,DeepSeek发布并开源了DeepSeek-R1模型,该模型在数学、代码、自然语言推理等任务上,性能与OpenAIo1正式版相当。2025年1月27日,DeepSeek发布多模态大模型Janus-Pro,在文字转图像性能上比肩DALL-E3等主流多模态模型。
图表1 DeepSeek发展历程及模型发布
时间
事件
2023年7月17日
幻方量化成立了DeepSeek。
2023年11月2日
DeepSeek发表开源代码大模型DeepSeek-Coder,这是深度求索的第一个大模型。与之前最好的开源大模型CodeLlama相比,DeepSeekCoder在代码生成任务上(使用标准数据集HumanEval、MBPP
和DS-1000进行评测)分别领先9.3%、10.8%和5.9%。
2023年11月29日
DeepSeek发布通用大语言模型DeepSeek-LLM。相比开源的同级别模型LLaMA270B,DeepSeek
LLM67B在近20个中英文的公开评测榜单上表现更佳。
2024年1月11日
DeepSeek发布DeepSeek-MoE,性能超越Llama2-7B,且计算量降低60%。
2024年2月5日
DeepSeek发布DeepSeekMath,DeepSeekMath在竞赛级MATH基准测试中获取了51.7%的优异成
绩,且未依赖外部工具包和投票技术,接近Gemini-Ultra和GPT-4的性能水平。
2024年3月11日
DeepSeek发布DeepSeek-VL。
2024年5月
DeepSeek发布并开源了旗下MoE大模型DeepSeek-V2,因其模型架构与经济性而脱颖而出,DeepSeek-V2的API定价为每百万tokens输入1元、输出2元,价格仅为GPT-4Turbo的百分之
一。DeepSeek解释称,DeepSeek-V2采用了创新的架构,例如注意力机制方面的MLA(多头潜在注意力)和前馈网络方面的DeepSeekMoE架构等,以实现具有更高经济性的训练效果和更高效的推
理。
2024年6月17日
DeepSeek发布DeepSeek-Coder-V2,DeepSeek-Cod
您可能关注的文档
- 技术择时策略2024年跟踪回顾:技术择时策略2024年度表现亮眼.docx
- 加密资产系列报告之一:特朗普加密数字货币政策影响及展望.docx
- 家电行业2024年四季报前瞻:内外销景气回升,政策成效显著.docx
- 家用电器行业2025M1白电月报:家空强势收官,龙头白电份额回升.docx
- 假日景气跟踪:利率-春节期间海内外有哪些变化?.docx
- 价格全方位多维跟踪体系:节前金价上升,油价抬升带动化工涨价潮.docx
- 建材行业分析:消费建材C端属性占优,水泥、玻纤或迎底部上行.docx
- 建筑材料行业深度报告:居住产业链2024Q4公募基金持仓仍处低位,建筑、建材行业有所增配.docx
- 建筑装饰行业持仓环比回升,房建板块增持明显——2024Q4建筑基金持仓分析.docx
- 健盛集团订单与管理改善共振,期待无缝净利率弹性.docx
- 2025年全国演出经纪人员资格认定考试试卷带答案(研优卷).docx
- 2025年全国演出经纪人员资格认定考试试卷完整版.docx
- 2025年全国演出经纪人员资格认定考试试题库及完整答案.docx
- 2025年全国演出经纪人员资格认定考试试卷完美版.docx
- 2025年全国演出经纪人员资格认定考试试卷含答案(实用).docx
- 2025年全国演出经纪人员资格认定考试试卷及答案(各地真题).docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
- 2025年全国演出经纪人员资格认定考试试卷及答案1套.docx
- 2025年下半年四川成都市郫都区面向社会引进公共类事业单位人员2人备考题库最新.docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
最近下载
- GB45673-2025《危险化学品企业安全生产标准化通用规范》解读.pptx
- SH15-M-40010非晶合金变压器设计.docx VIP
- 青岛市2025-2026学年(上期)高三期末考试政治试卷(含答案).docx
- 2025届高考物理二轮复习热点题型归类-专题06 牛顿运动定律的综合应用(教师版).docx VIP
- ASTME8/E8M2021金属拉伸实验最新美标中文版.pdf VIP
- 中国美术水墨画课件.pptx VIP
- Why Nations Fail书.pdf VIP
- 【高考真题】全国2024年统一高考物理真题试卷(新课标)附解析.docx VIP
- 2025届高考物理热点题型归类专题11功和功率及动能定理的理解与应用讲义+变式演练.pdf
- 幼儿园小班手指游戏集(13个) 幼儿园小班游戏教案.doc VIP
原创力文档

文档评论(0)