- 12
- 0
- 约3.96千字
- 约 9页
- 2024-10-22 发布于北京
- 举报
OpenAI接连重磅发布,Canvas变革写作/编程范式
OpenAI发布全新API功能,多模态+降本进一步繁荣自身开发者生态。此次OpenAI开发者大会发布了实时语音交互API、视觉微调API、提示词API、模型蒸馏四大新功能。我们认为,OpenAIGPT系列目前仍然是全球范围内“最智能”的大模型,其强大的Zero-shot能力使其能适应多样化场景,结合广大开发者落地定制有望加快AI应用在各个领域落地。
图
图1.OpenAIdevday2024发布的4大新功能
数据来源:OpenAI,
实时语音交互API:省去中介步骤,语音助手普适化。传统的语音助手开发一般至少需要用到3个模型:STT(语音转文字模型)、LLM、TTS(文字转语音模型),中间需要对每一步的结果进行处理、审核、优化等,流程过于繁琐,故此一般仅有偏大型企业才有资源开发。而Open此次发布的Real-timeAPI由多模态模型GPT4o支持,对开发者而言省去了大量中间转换步骤,语音助手有望向中小微、个体类企业/商户甚至C端交互场景渗透,进而迸发出更丰富的应用创新以及庞大的算力需求。
图
图2.VoiceagentwithSTT,LLM,TTS
数据来源:Livekit,
视觉微调API:小量数据办大事。基于GPT4o强大的Ze
您可能关注的文档
最近下载
- 2025年广西壮族自治区基层法律服务工作者管理考试题及答案.docx VIP
- 2025河南省机关事业单位工勤技能人员培训考核教材职业道德全部考试题.docx VIP
- 2025年静脉治疗竞赛试题及答案.docx VIP
- CSCO膀胱癌诊疗指南(2025版).docx VIP
- 2025年浙江省基层法律服务工作者考试题及答案.docx VIP
- 2025年西藏基层法律服务工作者考试题及答案.docx VIP
- 2025年陕西省基层法律服务工作者考试题及答案.docx VIP
- 2025年湖南省基层法律服务工作者考试题及答案.docx VIP
- 2025年江西省基层法律服务工作者资格考试题及答案.docx VIP
- 2026年汽车行业面试题及新能源汽车技术含答案.docx VIP
原创力文档

文档评论(0)