大语言模型的幻觉检测
演讲人:杨熙
北京智源人工智能研究院
智能评测负责人
yangxi@
CONTENTS
02幻觉定义及检测方法
01背景与动机
04总结与展望
03幻觉检测工具构建
目录
背景与动机
大模型创新技术发展的同时,我们还必须不断探索大模型评测技术
大模型能力评估:打造丈量“高山”的尺子
我们所希望的
实际可能的
甚至有可能
大模型能力评估:打造丈量“高山”的尺子
•我们不能预估模型的能力,只能不断探索大模型能力的边界
模型能力探索
模型评测
a发展大模型创新技术的同时,我们必须探索大模型评测技术
科技部:科技创新2030—“新
原创力文档

文档评论(0)