计算机行业国庆假期,科技行业都发生了什么?.pdfVIP

计算机行业国庆假期,科技行业都发生了什么?.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

行业专题报告/证券研究报告

1OpenAI接连重磅发布,Canvas变革写作/编程范式

OpenAI发布全新API功能,多模态+降本进一步繁荣自身开发者生态。此次

OpenAI开发者大会发布了实时语音交互API、视觉微调API、提示词API、模型

蒸馏四大新功能。我们认为,OpenAIGPT系列目前仍然是全球范围内“最智能”

的大模型,其强大的Zero-shot能力使其能适应多样化场景,结合广大开发者落

地定制有望加快AI应用在各个领域落地。

图1.OpenAIdevday2024发布的4大新功能

数据来源:OpenAI,财通证券研究所

⚫实时语音交互API:省去中介步骤,语音助手普适化。传统的语音助手开发

一般至少需要用到3个模型:STT(语音转文字模型)、LLM、TTS(文字转

语音模型),中间需要对每一步的结果进行处理、审核、优化等,流程过于繁

琐,故此一般仅有偏大型企业才有资源开发。而Open此次发布的Real-time

API由多模态模型GPT4o支持,对开发者而言省去了大量中间转换步骤,语

音助手有望向中小微、个体类企业/商户甚至C端交互场景渗透,进而迸发出

更丰富的应用创新以及庞大的算力需求。

图2.VoiceagentwithSTT,LLM,TTS

数据来源:Livekit,财通证券研究所

谨请参阅尾页重要声明及财通证券股票和行业评级标准3

行业专题报告/证券研究报告

⚫视觉微调API:小量数据办大事。基于GPT4o强大的Zero-shot能力,客户

只需要少量的特定场景图像数据,便可极大程度提升相关场景AI的任务成

功率、识别准确率等。如Grab仅用100张图便将车道计数的准确性提高20%,

并且将速度限制标志的定位精度提高13%;Automat使用200张未结构化的

保险文档的图片,将信息提取任务的F1得分提升了7%等。

图3.GPT4o经过少量图片微调后的识别任务示例

数据来源:OpenAI,财通证券研究所

⚫提示词缓存优化:若重复,输入token降本50%,时延降低80%。model

prompts通常包含重复的内容,比如系统提示和常见指令,OpenAI现在的API

会缓存提示词,并自动识别重复内容(无需更改代码,无额外收费,即可生

效)。对于长提示,这可以减少高达80%的延迟和50%的成本。

图4.提示词缓存优化后的输入token定价以及何谓Cached示意

数据来源:OpenAI,财通证券研究所

⚫模型蒸馏服务:以GPT为基础定制专属+低成本+低时延小模型。该服务制

定了一个便捷的蒸馏流程:1.首先将特定场景任务中“大模型”(如o1-preview

或GPT4o等)的高质量输出存储;2.用OpenAI的evals建立基准

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档