深度学习揭秘系列之四:DeepSeek大模型如何助力投研?.docx

深度学习揭秘系列之四:DeepSeek大模型如何助力投研?.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

作为网页版的功能进阶形态,DeepSeekAPI具有更高的灵活性与可拓展性,为开发者与企业用户提供更具工程价值的接入方案。

DeepSeek模型可选API丰富,用户可以结合自身需求进行参数的灵活设置。

以火山引擎为例使用DeepseekAPI,通过python或ExcelVBA实现相关功能。DeepSeekAPI支持Python、ExcelVBA等多语言调用,实现金融数据处理、行情获取等功能。

本地部署适用于处理敏感数据、需要满足定制化需求、或者需合规性保障的用户,但是对于配置条件有一定的要求。

建议有需求的用户结合最低显存估算选择相应模型通过Ollama部署,进一步可以利用浏览器插件实现联网、构建本地知识库等功能。

CherryStudio是一款集多模型对话、知识库管理、AI绘画、翻译等功能于一体的全能AI助手平台,支持本地部署大模型与多方API的调用。

作为深度整合的智能工作平台,用户可以通过CherryStudio调用云端

DeepSeekAPI以及本地部署大模型。

嵌入模型有本地部署与外部API两种配置方式。构建知识库之前,用户可以通过Ollama部署本地嵌入模型,也可以通过外部API配置嵌入模型,文中介绍了通过JinaAI网站获得免费tokens的方式。

通过多种文件添加方式,用户可以便捷创建本地知识库,构造多模态智能知识中枢,结合大模型实现不同场景赋能。

风险因素:研究基于历史情况,存在失效及偏差风险;大语言模型输出存在幻觉与随机性,不同模型性能具有差异,产品功能具有时效性局限。

目录

一、DeepSeek开源模型兼具高性能与高性价比 6

、兼具高性能与高性价比,DeepSeek开源模型引发市场关注 6

、DeepSeek-V3:多重技术亮点实现性能与性价比双重突破 8

、DeepSeek-R1:基于DeepSeek-V3的强大的推理模型 10

二、网页对话实现智能服务体系 12

、网页版DeepSeek访问渠道丰富 12

、DeepSeek官网实现智能问答与文档解析功能 12

、秘塔AI实现学术资源智能检索 13

、纳米AI实现可视化思维建构 14

、腾讯元宝擅长公众号内容调用 15

、DeepSeek结合Kimi+实现自动化办公输出 16

三、DeepSeekAPI实现智能中枢构建 18

、DeepSeek模型可选API丰富 18

、以火山引擎为例使用DeepseekAPI 19

、DeepSeekAPI接入Excel与Python 20

四、DeepSeek本地部署条件与功能 22

、DeepSeek本地部署GPU估算 22

、通过Ollama进行DeepSeek本地部署 23

、利用浏览器插件实现联网、构建本地知识库 24

五、利用交互应用软件构建知识库 25

、CherryStudio的使用方式 25

、CherryStudio嵌入模型配置 25

、CherryStudio构建本地知识库 26

风险因素 29

表目录

表1:DeepSeekR1等模型性能对比 6

表2:DeepSeek模型部分网页访问渠道 12

表3:DeepSeek模型部分API访问渠道 18

表4:DeepSeekAPI建议场景设置温度 18

表5:DeepSeek本地部署最低显存估算 22

图目录

图1:DeepSeek-V3训练成本 7

图2:DeepSeek-V3等模型性能/价格比 7

图3:DeepSeek-R1等推理模型API价格 7

图4:DeepSeek-V3-0324性能对比 8

图5:DeepSeek-V3的基本架构 8

图6:MTP图解 9

图7:FP8混合精度训练框架 10

图8:DeepSeek-R1-Zero在RL过程中平均响应长度 10

图9:DeepSeek-R1-Zero“aha”时刻 11

图10:DeepSeek-R1蒸馏模型与其他推理模型对比 11

图11:DeepSeek官网与手机APP渠道 12

图12:DeepSeek官方对话网页 12

图13:DeepSeek运行状态 13

图14:秘塔AI网页 13

图15:详细信息来源 14

图16:相关事件 14

图17:相关组织 14

图18:纳米AI思维导图1 15

图19:纳米AI思维导图2 15

图20:腾讯元宝模型选择 15

图21:腾讯元宝:以公众号文章为主要参考来源 16

图22:Markdown格式PPT大纲 16

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档