北京市基于大模型的政务咨询场景建设-采购需求.docxVIP

北京市基于大模型的政务咨询场景建设-采购需求.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

46

北京市基于大模型的政务咨询场景建设采购需求

一、项目背景

2023年5月23日,北京市人民政府办公厅印发了《北京市促进通用人工智能创新发展的若干措施》(京政办发〔2023〕15号),提出开展大模型创新算法及关键技术研究,围绕模型构建、训练、调优对齐、推理部署等环节,积极探索基础模型架构创新,研究大模型高效并行训练技术和认知推理、指令学习、人类意图对齐等调优方法,形成完整高效的技术体系,鼓励开源技术生态建设。明确要求推动在政务服务领域示范应用,围绕政务咨询、政策服务、接诉即办、政务办事等工作,利用人工智能在语义理解、自主学习和智能推理等方面的能力优势,提高政务咨询系统问答水平。本项目将按照上述文件要求开展相关工作。

二、项目建设内容

项目建设内容包括应用软件开发(知识中枢建设、任务调度模块建设、政务咨询智能体建设)、数据资源建设、大模型调用和云上其他服务。

1.知识中枢建设

1.1外部素材库

通过对接各单位知识库等系统,定时抓取汇总到外部素材库中,对这些知识进行知识清洗、图像识别、文本解析等工作将知识内容解析成可识别的文字后再进行知识内容进行重复检测、冲突检测,并可提交采用流程。包括:

1.1.1单位政务知识库定制化开发对接

通过接口对接实现定期调用各单位知识系统提供的标准知识,保证知识及时获取和更新。

1.1.2知识清洗

开发数据清洗模块,对知识中HTML格式符号等格式问题,将清洗的后的知识存储入库。

1.1.3文本解析

对知识的附件,格式包括doc、docx、PDF等,开发文本解析模块,将文件中内容解析成系统可识别的文字。

1.1.4OCR识别

对知识段落内包含的图片、链接,开发自动获取并存储图片数据功能,利用开源OCR模型开发OCR识别功能,提取图片内容并还原至原文中。

47

1.1.5政务文件消歧管理

通过对接获取的增量数据与已采用入库的数据自动进行知识内容重复及冲突比对并展示结果及内容。

1.1.6知识采用

对经过处理后的知识由用户进行采用至知识底库模块。

1.1.7知识供给接口开发

开发提供对外知识供给标准接口,实现对外供给知识服务。

1.2知识底库

汇聚外部素材库中已采用的知识数据,可以对知识数据进行管理维护并可对知识进行文本切片、QA知识智能生成等操作,处理之后的文本切片和QA知识分别存储于知识管理库相应的模块中并具备冲突检测功能还能对其原始知识进行溯源。包括:

1.2.1相关政务文本管理

对外部素材库中采用的各类知识数据进行编辑、查询、删除等常规操作,另外开发创建知识功能。

1.2.2文本智能切片

开发文本内容智能切片,保证段落内容完整可用。

1.2.3QA智能生成

利用大模型以文章切片和提示词作为输入,智能生成一批与文章片段内容相关的QA知识,并将这些知识存储到知识库中。

1.2.4QA知识冲突检测

对增量入库的QA知识与知识库中旧知识进行比对,发现新旧知识差距,辅助运维人员开展知识处理。

1.2.5政务问答对管理

支持增删改QA类知识,支持搜索查询,支持批量上传、删除、批量生效/失效。

1.2.6知识溯源

48

将政务问答对逐个选择关联相关政策文件,建立用户自定义上传的问答对与政策文件之间的关联关系。

1.3知识管理

针对单位业务专家录入的标准问答、内部知识等数据进行管理,支持知识编辑、存储、溯源等配置操作,同时具备维护风控拒答模板、政务词库、敏感词库、知识数的功能,还可对热门知识进行管理。包括:

1.3.1QA库

将知识底库中由大模型生成的QA、用户自定义上传的QA汇总管理,包括对知识的编辑、删除、批量上线、批量下线等功能。

1.3.2切片库

将知识底库中文本智能切片汇总管理,包括对切片的编辑、删除、批量上线、批量下线等功能。

1.3.3风控拒答模版库

管理安全风控应答口径知识、非政务范围等的拒答模版知识。

1.3.4政务词库

将涉及较专业的业务专有词汇、百姓常用词汇、业务词汇等词汇一一对应,并进行配置管理。

1.3.5敏感词库

提供敏感词增删改模块,用于管理风控链路中敏感词检测环节。

1.3.6知识树

为实现大模型多轮问答,需对业务逻辑配置,建立知识引导树。搭建知识树体系及层级节点并构建节点提示词、挂接相关QA知识等用于引导用户提问。

1.3.7热门知识管理

对关注度高的热门问题及高频知识进行定期管理,支持录入编辑热门问题和答案,用户点击问题后,直接给出标准答案。

1.4知识回流管理

针对测评数据和对话数据建立回流配套功能管理,业务专家可执行测评任务辅助提升问答水平,同时对回流数据进行分析,进而查漏补缺,提高知识利用效率。包括:

49

1.4.1问答效果专家评测

专家AI评测

为业务专家提供问答测评窗口,供业务专家自由提问测评、打分及备注功能。

评测字典管理

提供测评字典后台修改选项的功能,由管

您可能关注的文档

文档评论(0)

尘曦辰 + 关注
实名认证
文档贡献者

信息系统项目管理师持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年11月02日上传了信息系统项目管理师

1亿VIP精品文档

相关文档