章平-从盲目调优到数据驱动-大规模 Agent 的评估工程实践.pdf

章平-从盲目调优到数据驱动-大规模 Agent 的评估工程实践.pdf

从盲目调优到数据驱动

大规模Agent的评估工程实践

章平|亚马逊云科技

01真实案例:旅游搜索Agent的7周质量隐形降级

02Agent评估的挑战

03Agent评估工程的方法论

目录

04

文档评论(0)

1亿VIP精品文档

相关文档