- 0
- 0
- 约1.05万字
- 约 15页
- 2026-03-11 发布于广西
- 举报
T/CES325—2024电力系统的大语言模型微调数据准备规范
前言
本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。
本文件由中国电力企业联合会(CES)提出并归口。
本文件起草单位:电力系统科研院所、电力企业、人工智能技术企业、高等院校、检测认证机构等。
本文件主要起草人:[可填写主要起草人姓名及所在单位]
本文件为首次发布。
本文件规定了电力系统领域大语言模型(以下简称“LLM”)微调数据准备的术语和定义、总则、数据来源与分类、数据采集要求、数据预处理要求、数据质量评估、数据存储与管理、数据安全与合规要求等内容。本文件适用于电力系统规划、调度运行、设备运维、电力营销、安全管理等各类场景下LLM微调数据的准备工作,可作为电力行业LLM研发、应用及验收的技术依据,规范电力系统LLM微调数据的质量,推动LLM在电力系统领域的标准化、规范化应用。
1范围
本文件规定了电力系统大语言模型微调数据准备的术语和定义、总则、数据来源与分类、数据采集、数据预处理、数据质量评估、数据存储与管理、数据安全与合规等要求。
本文件适用于电力系统相关LLM(包括但不限于电力调度、设备运维、客户服务、安全管控等专用模型)微调过程中的数据准备工作,涵盖数据从采集、预处理、质量评估到存储管理的全流程,适用于电力企业、科研机构、人工智能企业等开展电力系统LLM微调数据准备相关活动,不适用于通用大语言模型的基础训练数据准备。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T1.1—2020标准化工作导则第1部分:标准化文件的结构和起草规则
GB/T25000.10—2018系统与软件工程系统与软件质量要求和评价(SQuaRE)第10部分:系统与软件质量模型
GB/T31168—2014信息安全技术数据安全分级指南
GB/T35273—2020信息安全技术个人信息安全规范
GB/T38664—2020信息安全技术数据安全指南
DL/T448—2016电能计量装置技术管理规程
DL/T596—2021电力设备预防性试验规程
DL/T1866—2018电力大数据数据质量评估规范
ISO/IEC27001:2022信息安全管理体系要求
IEEE1815—2018智能电子设备(IED)的电力系统通信标准
3术语和定义
下列术语和定义适用于本文件。
3.1电力系统大语言模型(PowerSystemLargeLanguageModel,PS-LLM)
针对电力系统领域特定场景(如调度运行、设备运维、电力营销等),基于通用大语言模型进行微调,具备电力专业知识理解、专业问题解答、场景化任务处理能力的语言模型。
3.2微调数据(Fine-tuningData)
用于对通用大语言模型进行微调,使模型适配电力系统特定场景、提升专业性能的高质量数据集合,包括文本数据、结构化数据及半结构化数据。
3.3数据采集(DataCollection)
从电力系统各类数据源中获取微调所需原始数据的过程,包括主动采集、接口调用、数据共享等方式。
3.4数据预处理(DataPreprocessing)
对采集的原始数据进行清洗、转换、标注、格式标准化等一系列处理,使其满足LLM微调要求的过程。
3.5数据质量评估(DataQualityEvaluation)
对预处理后的微调数据进行完整性、准确性、一致性、时效性、相关性等维度的检验与评价,确保数据符合微调要求的过程。
3.6敏感数据(SensitiveData)
电力系统中涉及国家安全、商业秘密、个人隐私及系统运行安全的各类数据,包括但不限于调度数据、设备核心参数、用户个人信息、电力交易数据等。
3.7数据标注(DataAnnotation)
对微调数据进行人工或自动标记,标注内容包括类别、实体、关系、指令-响应对应关系等,用于提升模型微调效果的过程。
4总则
4.1基本原则
4.1.1合规性原则:数据采集、预处理、存储、使用等全流程应符合国家法律法规、行业标准及相关规定,确保数据来源合法、使用合规,杜绝违规采集、泄露敏感数据。
4.1.2高质量原则:微调数据应具备完整性、准确性、一致性、时效性和相关性,避免冗余、错误、过时数据,确保数据能够有效提升模型微调效果。
4.1.3针对性原则:数据准备应结合电力系统特定应用场景(如调度运行、设备运维等)和模型微调目标,聚焦场景需求,确保数据与微调任务高度匹配。
4.1.4安
您可能关注的文档
- T_CAREI 016—2025 基于项目的温室气体减排量评估技术规范 秸秆打捆直燃供热工程.docx
- T_JSREA 1003—2025 大型电站锅炉水冷壁爬壁机器人规范.docx
- T_CES 353—2025 电化学储能用压缩空气泡沫灭火系统技术规范.docx
- T_CES 356—2025 电磁线圈灭火炮技术规范.docx
- T_ZJSEE 0039—2025 供电所清廉服务监督评价规范.docx
- T_ACCEM 669—2025 水电站计算机监控系统国产化改造技术导则.docx
- T_ZJSEE 042—2025 供电所数智化融合仓建设技术规范.docx
- T_CMEEEA 022—2025 电力工程安全管理规范.docx
- T_HAS 157—2025 光伏直流系统柔性架构施工技术规程.docx
- T_CES 327—2024 电力虚拟数字人指标要求和评价规范.docx
原创力文档

文档评论(0)