ieval:大模型评测系统建设和应用.docx

iEval:大模型评测系统建设和应用

欧阳灿|腾讯

欧阳灿

腾讯高级工程师,iEval评测系统负责人

腾讯工程效能11级,近十年来一直从事DevOps/AIOps研发效能、AI评测等工作,目前负责微信技术架构部AI业务评测、大模型评测,负责iEval体验评测平台开发,主导iEval-LLM-Bench评测框架建设。

I.大模型评测面临的挑战

目录CONTENTSII.

目录

CONTENTS

III.iEval大模型评测系统

IV.自助开启大模型评测

V.业务项目评测实践

PART01

大模型评测面临的挑战

为什么需要

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档