- 1、本文档共58页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Deepseek内部研讨系列
DeepSeek原理与落地应用
AI肖睿团队
(孙萍、吴寒、周嵘、李娜、张惠军、刘誉)
2025年03月01日
厦门大学大数据百家讲坛
?北大青鸟人工智能研究院
?北大计算机学院元宇宙技术研究所
?北大教育学院学习科学实验室
NI
898
目录
CONTENTS
DeepSeekR
DeepSeekR1落地应用
PART01
人工智能概念辨析
l多模态
文本、图片、音频、视频
lAI工具(国内)
DeepSeek、豆包、Kimi、腾讯元宝、智谱清言、通义千问、秘塔搜索、微信搜索...
l通用模型
大语言模型(LLM,LargeLanguageModel)
视觉模型(图片、视频)
音频模型
多模态模型……
l行业模型(垂直模型、垂类模型)
教育、医疗、金融等
?人工智能:让机器具备动物智能,人类智能,非人类智能(超人类智能)
?运算推理:规则核心;自动化
?知识工程:知识核心;知识库+推理机
?机器学习:学习核心;数据智能(统计学习方法,数据建模)
?常规机器学习方法:逻辑回归,决策森林,支持向量机,马尔科夫链,…..
?人工神经网络:与人脑最大的共同点是名字,机制和架构并不一样
?传统神经网络:霍普菲尔德网络,玻尔兹曼机,…..
?深度神经网络:深度学习
?传统网络架构:DBN,CNN,RNN,ResNet,Inception,……
?Transformer架构:可以并行矩阵计算(GPU),核心是注意力机制(Attention)
?编码器(BERT):多数embedding模型,Ernie早期版本,…….
?混合网络:T5、GLM
?解码器(GPT):大语言模型(LLM),也是传统的多模态模型的核心
?生成式人工智能(GenAI):AIGC
?DeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、……?OpenAIGPT(ChatGPT)、Claude、Llama、Grok、……
?Diffusion架构:主要用于视觉模型(比如StableDiffusion、DALLE),现在也开始尝试用于语言模型
?Diffusion+Transformer架构:例如Sora的DiT(加入Diffusion的视觉模型),部分新的多模态模型架构
生成模型推理模型
ref:中文大模型基准测评2024年度报告(2025.01.08)
比较项
OpenAIGPT-4o(生成模型)
OpenAIo1(推理模型)
模型定位
专注于通用自然语言处理和多模态能力,适合日常对话、内容生成、翻译以及图文、音频、视频等信息处理、生成、对话等。
侧重于复杂推理与逻辑能力,擅长数学、编程和自然语言推理任务,适合高难度问题求解和专业领域应用。一般是在生成模型的基础上通过RL方法强化CoT能力而来
推理能力
在日常语言任务中表现均衡,但在复杂逻辑推理(如数学题求解)上准确率较低。
在复杂推理任务表现卓越,尤其擅长数学、代码推理任务。
多模态支持
支持文本、图像、音频乃至视频输入,可处理多种模态信息。
当前主要支持文本输入,不具备图像处理等多模态能力。
应用场景
适合广泛通用任务,如对话、内容生成、多模态信息处理以及多种语言相互翻译和交流;面向大众市场和商业应用。
适合需要高精度推理和逻辑分析的专业任务,如数学竞赛、编程问题和科学研究;在思路清晰度要求高的场景具有明显优势,比如采访大纲、方案梳理。
用户交互体验
提供流畅的实时对话体验,支持多种输入模态;用户界面友好,适合大众使用。
可自主链式思考,不需要太多的过程指令,整体交互节奏较慢。
PART02
DeepSeekR1
公司成立背景与
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023
发展历程
年7月17日,是一家创新型科技企业,专注于人工智能基础技术的研究与开发
大语言模型(LLM)DeepSeek专注于开发先进的大语言模型(LLM)和相关技术,旨在通过这些技的创新应用术推动人工智能在多个领域的应用和创新
投资者背景与市场定位
作为由知名私募巨头幻方量化孕育而生的公司,DeepSeek获得了强大的资金支持和行业影响力,幻方量化与九坤投资、明汯投资、灵均投资并称量化私募领域的“四大天王”,管理资金规模均超过600亿元。这为DeepSeek提供了清晰的市场定位和投资者背景
里程碑2025
您可能关注的文档
- 电子行业深度研究报告:AI眼镜洞见未来,SoC智控万物互联.docx
- 餐饮行业产品上新报告(2025年1月)-红餐研究院.docx
- 2024年度中国电商服务商消费投诉数据与典型案例报告-网经社.docx
- 2025面向工程审计行业的DeepSeek大模型应用指南.docx
- 2024年度中国品牌电商消费投诉数据与典型案例报告-网经社.docx
- 2025年deepseek技术全景解析报告-重塑全球AI生态的中国力量.docx
- 2025年防晒市场洞察及趋势前瞻.pptx
- 2024年中国汽车产业出海回顾分析-中汽信科国际化研究团队.pptx
- 连锁超市品牌小红书营销推广方案.docx
- 对标一流-2025年国央企风控合规案例白皮书-启信慧眼.docx
最近下载
- Lois Lowry - Number the Stars英文原版儿童读物电子版下载.docx VIP
- 北师大版数学六年级下册《正比例》王沛荣老师陕西省省级优课课件.ppt
- 云南省红河州弥泸大型灌区工程(水利水电建设项目)中水北方2020年.pdf VIP
- 静脉导管常见并发症临床护理实践指南附有答案.docx
- 胆管癌诊治指南更新解读2024(全文) .pdf
- 金匮要略习题及答案汇总.pdf VIP
- DeepSeek入门宝典培训课件.pptx
- 2025届高考专题复习:小说人物形象+课件.pptx VIP
- 2025届湖北省重点学校高三第一次联合测评(一模)语文试题和答案详解.pdf
- 《主动脉夹层与急诊》课件.ppt VIP
文档评论(0)