iEval:大模型评测系统建设和应用
欧阳灿|腾讯
欧阳灿
腾讯高级工程师,iEval评测系统负责人
腾讯工程效能11级,近十年来一直从事DevOps/AIOps研发效能、AI评测等工作,目前负责微信技术架构部AI业务评测、大模型评测,负责iEval体验评测平台开发,主导iEval-LLM-Bench评测框架建设。
I.大模型评测面临的挑战
目录CONTENTSII.
目录
CONTENTS
III.iEval大模型评测系统
IV.自助开启大模型评测
V.业务项目评测实践
PART01
大模型评测面临的挑战
为什么需要
您可能关注的文档
- 上海地产洋房年度传播升级思考【AIGC】【全案推广】.docx
- 快消零售牙膏品牌抖音达人投放策划方案【电商】【抖音营销】【投放】.docx
- TimeHF:供应链时序大模型的工业革新.docx
- OPPO数据湖加速大模型训练.docx
- OPPO 多模态大模型端侧化应用实践.docx
- mPLUG-多模态对话大模型技术与应用解析.docx
- MegatronApp:面向万亿参数大模型的训练与推理增强实践.docx
- InfiniSynapse:开拓大模型的第二个杀手级应用场景.docx
- AI大模型评测能力建设及实践.docx
- 宣贯培训(2026年)《NYT 4496-2025 白菜型油菜品种鉴定 SSR 分子标记法》.pptx
- 宣贯培训(2026年)《NYT 4512-2025 非洲菊疫病抗性鉴定技术规程》.pptx
- 宣贯培训(2026年)《NYT 4514-2025木薯副产物综合利用导则》.pptx
- 宣贯培训(2026年)《NYT 4513-2025木薯全程机械化生产技术规范》.pptx
- 宣贯培训(2026年)《NYT 4470-2025全株玉米青贮质量分级》.pptx
- 宣贯培训(2026年)《NYT 4468-2025玉米供需平衡表编制规范》.pptx
- 宣贯培训(2026年)《NYT 4469-2025全株玉米青贮质量评定 综合指数法》.pptx
- 宣贯培训(2026年)《NYT 4474-2025东北地区玉米-大豆轮作生产技术规程》.pptx
- 宣贯培训(2026年)《NYT 4472-2025玉米耐盐碱鉴定评价技术规程》.pptx
- 宣贯培训(2026年)《NYT 4473-2025玉米抗旱性鉴定评价技术规程》.pptx
- 宣贯培训(2026年)《NYT 4478-2025甘薯收获技术规程》.pptx
最近下载
- 新版湘少版四年级下册英语教案全册.doc
- 教科版小学六年级下册综合实践活动主题二 第2课 我给学校提建议(课件).pptx VIP
- FR-WI-08-23 环境管理物质执行标准 A21.xls VIP
- 比亚迪环境管理物质标准A6.pdf VIP
- 大数据视角下小学生学习能力评价与提升策略实践教学研究课题报告.docx
- 2025年落实上级统计督察整改工作情况的报告范文.docx VIP
- HSF001--A1环境管理物质管理标准.doc VIP
- 外军管理概论题库及答案.doc VIP
- T SHJNXH 0021—2025 电化学储能电站运行综合能效等级及评价.pdf VIP
- 2025年外军管理概论试题及答案.docx VIP
原创力文档

文档评论(0)