大语言模型金融领域应用评测指南.pdfVIP

  • 5
  • 0
  • 约6.41万字
  • 约 29页
  • 2025-12-30 发布于上海
  • 举报

ICS35.240.40

CCSA11

团体标准

XX/XXXXX—XXXX

大语言模型金融领域应用评测指南

EvaluationguideforLargeLanguageModelinfinancialapplications

(征求意见稿)

2025-XX-XX发布2025-XX-XX实施

四川省支付清算协会

四川省金融学会发布

重庆市金融学会

XX/XXXXX—XXXX

目次

前言II

引言III

1范围4

2规范性引用文件4

3术语和定义4

4评测原则5

5评测维度5

5.1概述5

5.2性能效率6

5.3信息抽取能力7

5.4信息归纳能力7

5.5指令遵循能力7

5.6规避风险能力8

5.7逻辑能力8

5.8工具调用能力8

5.9文本真实性9

5.10输出稳定性9

5.11文本一致性9

5.12语言多样性10

5.13情绪与智力能力10

5.14想象力与类比关联能力11

6评测方法11

6.1准备评测数据11

6.2设计评测工具11

6.3搭建评测环境12

6.4评测执行12

6.5结果分析12

附录A(资料性)评测实施指南13

附录B(资料性)显存配置参考26

参考文献27

I

XX/XXXXX—XXXX

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由四川新网银行股份有限公司、西南财经大学金融科技国际联合实验室、重庆国家金融科技

认证中心提出。

本文件由四川省支付清算协会、四川省金融学会、重庆市金融学会归口。

本文件起草单位:四川新网银行股份有限公司、西南财经大学金融科技

文档评论(0)

1亿VIP精品文档

相关文档