CN119066223B 一种视频问答方法、装置、电子设备及存储介质 (浙江大华技术股份有限公司).pdfVIP

  • 1
  • 0
  • 约1.99万字
  • 约 19页
  • 2026-03-16 发布于重庆
  • 举报

CN119066223B 一种视频问答方法、装置、电子设备及存储介质 (浙江大华技术股份有限公司).pdf

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN119066223B

(45)授权公告日2025.01.17

(21)申请号202411570790.7G06N5/022(2023.01)

G06N5/01(2023.01)

(22)申请日2024.11.05

(56)对比文件

(65)同一申请的已公布的文献号

申请公布号CN119066223ACN116541490A,2023.08.04

CN118093956A,2024.05.28

(43)申请公布日2024.12.03

审查员梁丽霞

(73)专利权人浙江大华技术股份有限公司

地址310053浙江省杭州市滨江区滨安路

1187号

(72)发明人徐聪周永哲吴忠人黄鹏

(74)专利代理机构北京同达信恒知识产权代理

有限公司11291

专利代理师潘平

(51)Int.Cl.

G06F16/732(2019.01)

G06F16/783(2019.01)权利要求书2页说明书10页附图6页

(54)发明名称

一种视频问答方法、装置、电子设备及存储

介质

(57)摘要

本申请涉及人工智能技术领域,尤其涉及一

种视频问答方法、装置、电子设备及存储介质,用

于提高视频问答的答案准确度。该方法包括:获

取输入对象输入的问题,并抽取问题中的目标实

体;基于目标实体,查询目标视频所属场景对应

的场景知识图谱,获得第一搜索数据,并基于目

标实体,查询目标视频对应的时序知识图谱,获

得第二搜索数据,其中,时序知识图谱包含:各时

间段内,目标视频中的各候选实体间的交互关

系;基于第一搜索数据和第二搜索数据,通过大

语言模型LLM,获得问题的答案。这样,使得LLM在

B回答视频问题时会考虑场景知识和时序知识,提

3高了回答的准确度。

2

2

6

6

0

9

1

1

N

C

CN119066223B权利要求书1/2页

1.一种视频问答方法,其特征在于,包括:

获取输入对象输入的问题,并抽取所述问题中的目标实体;

提取目标文档中各第一候选实体间的直接关系,并为所述直接关系设置权重,其中,所

述目标文档包含目标视频所属场景的相关文本;

提取所述目标文档中所述各第一候选实体间的上下文接近关系,并为所述上下文接近

关系设置权重;

合并所述各第一候选实体间的直接关系和上下文接近关系,获得所述目标视频所属场

景对应的场景知识图谱;

基于所述目标实体,查询所述场景知识图谱,获得第一搜索数据,并基于所述目标实

体,查询所述目标视频对应的时序知识图谱,获得第二搜索数据,其中,所述时序知识图谱

包含:各时间段内,所述目标视频中的各候选实体间的交互关系;

基于所述第一搜索数据和所述第二搜索数据,通过大语言模型LLM,获得所述问题的答

案。

2.如权利要求1所述的方法,其特征在于,所述基于所述目标实体,查询目标视频所属

场景对应的场景知识图谱,获得第一搜索数据,并基于所述目标实体,查询所述目标视频对

应的时序知识图谱,获得第二搜索数据之前,还包括:

将所述目标视频的

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档