从盲目调优到数据驱动
大规模Agent的评估工程实践
章平|亚马逊云科技
01真实案例:旅游搜索Agent的7周质量隐形降级
02Agent评估的挑战
03Agent评估工程的方法论
目录
04
您可能关注的文档
- Clement-从推理到执行:构建 AI Agent 全链路无侵入可观测体系.pdf
- From Computer Use to Datacenter Use for AI数据中心应用.pdf
- Sunny Duan-智能体安全:基于AI Native的防御架构和实践.pdf
- 蔡明哲-从单点辅助到 Agent 闭环.pdf
- 蔡雪建-大前端性能优化新范式:AI 火焰图在亿级 App 中的落地.pdf
- 曹偲-DSL-Spec:TocoAI 的后端 Harness Engineering 实践.pdf
- 晁岳攀 (鸟窝)-智能体架构的降龙十八掌:从原型到工程落地的“生死取舍”.pdf
- 陈彪-ZillizTown:基于 Milvus 与 Claude Code 打造企业版 OpenClaw.pdf
- 打破“人月神话”,Agent 重塑风控场景产运研职能-王东旭.pdf
- 当 K8s 遇见 Ray:大模型时代 AI Workload 调度的通用范式.pdf
最近下载
- 完整版《中华人民共和国生态环境法典》全文解读PPT.pptx VIP
- 部编人教版二年级语文下册全套测试卷(配2026年春改版教材).pdf
- 2026新版人教版二年级下册数学期末试卷3套(含答案名师解析易错题专项)可直接打印.docx
- 2026年中考第一次模拟考试:生物一模模拟卷(新疆专用)(解析版) .pdf VIP
- 2026年天津中德应用技术大学辅导员招聘考试参考试题及答案解析.docx VIP
- (2025年)九江市浔阳区社区《网格员》典型题题库(含答案).docx VIP
- 北京地质灾害危险性评估报告资料精要.ppt VIP
- 老年社会工作:老年社区工作PPT教学课件.pptx VIP
- 老年社会工作:老年小组工作PPT教学课件.pptx VIP
- 湘美版高中美术第三单元第一课《亲近的人——素描、油画表现(二)》课件.pptx VIP
原创力文档

文档评论(0)