- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
DeepSeek洞察与大模型应用
人工智能技术发展与应用实践
联通数据智能有限公司
史树明
2025年;;DeepSeek公司概况;DeepSeek-V3;DeepSeek-R1;-5-;DeepSeek模型效果(2/2);
V3vs.R1:R1在普通的中文和英文任务上性能小幅领先,在数学和代码等需要深度推理的场景下明显胜出
R1蒸馏版vs.R1满血版:在数学、代码等场景下的性能有明显差距,蒸馏版参数量越小,与满血版差距越大
R1蒸馏版vs.V3满血版:140亿以上参数的R1蒸馏版的深度推理效果显著强于V3满血版;低参数量R1蒸馏版能力落后于V3;;
DS作为一款现象级应用,对全社会开展了一次人工智能科普再教育,DSC端应用人人装,人人感受人工智能,政府、企业管理者认识到人工智能战略意义,由探索尝试,升级为战略布局,市场进入爆发期;
DS开源策略全面冲击基础模型商业模式,将大厂在C端、B端过去一年构建的技术优势拉回同一起跑线
,市场竞争从一阶段比拼模型能力,进入比拼应用、数据、工程化交付能力的第二阶段;;中美在AI领域的对比:人才与技术;中美在AI领域的对比:企业
中美头部高科技企业的市值差距非常显著
我国AI独角兽的数量和估值落后于美国
头部高科技企业
美国7大科技公司市值:均在万亿美元以上,合计约18万亿美元
中国7大科技公司市值:第一名5600亿美元,合计约1.4万亿美元
AI独角兽;中美在AI领域的对比:GPU芯片;;;;国内主流大模型;国内外主流大模型工具/应用;;;;;;大模型赋能船舶设计;大模型赋能国产大飞机装备运维;大模型赋能文博文创;
DS优势在6000亿级语言大模型,在R1版惊艳的推理效果,在应用侧落地仍需要多模型组合、多外挂工具,以及大量工程化配合;;;
什么是大模型的幻觉?
生成式语言模型在生成文本或者回答问题时,产生与事实不符或者逻辑错误的内容,即“一本正经地胡说八道”
示例1:一篇根本不存在的参考文献(右图)
大模型幻觉产生的原因
目前的大模型结构和训练机制:基于概率的生成模型,本质上没有理解自己所学习的内容
缺乏对真实世界的有效建模方式和全息感知能力
训练数据的局限性:数据质量、重要数据的缺失、不同类型数据的比例
如何应对(用户角度)
建议1:建立“大模型结果不一定可信”的认知,根据自己的需要,对于模型的输出进行不同层次的验证(享受便利,控制风险)
建议2:通过大量使用而加深对一款大模型能力边界的理解:知道什么情况下模型输出更可靠,什么情况下更容易出现幻觉;
模型训练:算力消耗大
大模型庞大的参数量:通常包含数十亿到数千亿个参数
训练数据:通常包含数万亿到十几万亿token
训练时间:通常几个月
模型推理:算力消耗大,实时性差,支持的并发低
大模型庞大的参数量:通常包含数十亿到数千亿个参数
当前神经网络推理方式的特点:大量的矩阵乘法操作
Transformer推理阶段的“按token依次输出”机制:生成每个token的算力和时间消耗*token数
用户可感知的结果:DeepSeek投入大量算力提供服务,仍然频繁出现“服务器繁忙”;硅基流动等部署DeepSeek模型服务的第三方厂商亦无法有效承接流量
建议3:学会接受大模型的输出速度,效果越好的模型,速度可能越慢;认识大模型的局限性:知识实时更新能力差;认识大模型的局限性:偏见、隐私与安全
偏见
大模型的输出结果可能包含性别、种族、年龄、价值观、文化等偏见
核心原因:训练数据中包含了偏见信息(比如西方的数据中反映西方价值观的信息占比更大)
隐私与安全
难以避免生成有害内容:可能会输出虚假信息、脏黄反信息、宣扬暴力和仇恨的内容等
安全评估与防范难度大:大模型结构复杂、参数量众多、可解释性差
,给安全评估和防范带来了挑战
易受到有毒数据的攻击:多项研究表明,少量的有毒数据就可以显著提高模型输出错误或有害内容的可能性
建议5:问大模型的问题不要涉及政治敏感、黄赌毒、暴力、歧视等(有法律风险和被封禁的风险)
建议6:问大模型的问题中不要包含国家机密或者机构的商业秘密(有信息泄露风险和法律风险);认识大模型的优势和特色;谢谢!
您可能关注的文档
最近下载
- 2024-2025学年初中信息技术(信息科技)七年级全一册义务教育版(2024)教学设计合集.docx
- 《眼耳鼻咽喉口腔科护理学》教案 第13课 耳鼻咽喉科常见疾病患者的护理(三).docx VIP
- 2025年江苏南京中考语文试卷(真题--含答案) .pdf VIP
- 统编版(2024)道德与法治七年级上册期末复习全册知识点提纲.docx VIP
- 建筑工程述标(鲁班奖项目超高层框架结构技术答辩).pptx VIP
- 混凝土结构通用规范GB55008-2021知识培训.pptx VIP
- 《电梯关键部件寿命评估技术规范》.pdf VIP
- 高压氧舱技术的进步与挑战.docx VIP
- 消防考试试题100题及答案.docx VIP
- 2025电力企业数字化转型成熟度评价指南.pdf VIP
文档评论(0)