大模型评测幻觉检测.pptx

大语言模型的幻觉检测

演讲人:杨熙

北京智源人工智能研究院

智能评测负责人

yangxi@

CONTENTS

02幻觉定义及检测方法

01背景与动机

04总结与展望

03幻觉检测工具构建

目录

背景与动机

大模型创新技术发展的同时,我们还必须不断探索大模型评测技术

大模型能力评估:打造丈量“高山”的尺子

我们所希望的

实际可能的

甚至有可能

大模型能力评估:打造丈量“高山”的尺子

•我们不能预估模型的能力,只能不断探索大模型能力的边界

模型能力探索

模型评测

a发展大模型创新技术的同时,我们必须探索大模型评测技术

科技部:科技创新2030—“新

文档评论(0)

1亿VIP精品文档

相关文档