国庆假期,科技行业都发生了什么?.docxVIP

  • 12
  • 0
  • 约3.96千字
  • 约 9页
  • 2024-10-22 发布于北京
  • 举报

国庆假期,科技行业都发生了什么?.docx

OpenAI接连重磅发布,Canvas变革写作/编程范式

OpenAI发布全新API功能,多模态+降本进一步繁荣自身开发者生态。此次OpenAI开发者大会发布了实时语音交互API、视觉微调API、提示词API、模型蒸馏四大新功能。我们认为,OpenAIGPT系列目前仍然是全球范围内“最智能”的大模型,其强大的Zero-shot能力使其能适应多样化场景,结合广大开发者落地定制有望加快AI应用在各个领域落地。

图1.OpenAIdevday2024发布的4大新功能

数据来源:OpenAI,

实时语音交互API:省去中介步骤,语音助手普适化。传统的语音助手开发一般至少需要用到3个模型:STT(语音转文字模型)、LLM、TTS(文字转语音模型),中间需要对每一步的结果进行处理、审核、优化等,流程过于繁琐,故此一般仅有偏大型企业才有资源开发。而Open此次发布的Real-timeAPI由多模态模型GPT4o支持,对开发者而言省去了大量中间转换步骤,语音助手有望向中小微、个体类企业/商户甚至C端交互场景渗透,进而迸发出更丰富的应用创新以及庞大的算力需求。

图2.VoiceagentwithSTT,LLM,TTS

数据来源:Livekit,

视觉微调API:小量数据办大事。基于GPT4o强大的Ze

文档评论(0)

1亿VIP精品文档

相关文档