ieval:大模型评测系统建设和应用.pptxVIP

  • 2
  • 0
  • 约1.06万字
  • 约 38页
  • 2026-03-03 发布于山西
  • 举报

iEval:大模型评测系统建设和应用

欧阳灿|腾讯

腾讯工程效能11级,近十年来一直从事DevOps/AIOps研发效能、AI

评测等工作,目前负责微信技术架构部AI业务评测、大模型评测,负责iEval体验评测平台开发,主导iEval-LLM-Bench评测框架建设。

欧阳灿

腾讯高级工程师,iEval评测系统负责人

I.大模型评测面临的挑战

II.iEval模型库

III.iEval大模型评测系统

IV.自助开启大模型评测

V.业务项目评测实践

目录

CONTENTS

PART01

大模型评测面临的挑战

需求场景

模型体

文档评论(0)

1亿VIP精品文档

相关文档