CN120298851A 学习统一嵌入的方法和装置（谷歌有限责任公司）.pdfVIP

下载本文档

0
0
约2.93万字
约 24页
2026-01-24 发布于重庆
举报

CN120298851A 学习统一嵌入的方法和装置（谷歌有限责任公司）.pdf

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN120298851A

(43)申请公布日2025.07.11

(21)申请号202510270671.8G06N3/045(2023.01)

G06N3/09(2023.01)

(22)申请日2017.11.17

G06V10/764(2022.01)

(30)优先权数据

62/533,5352017.07.17US

(62)分案原申请数据

201780089483.92017.11.17

(71)申请人谷歌有限责任公司

地址美国加利福尼亚州

(72)发明人宋扬李源武勃C-Y·陈

张晓H·亚当

(74)专利代理机构北京市柳沈律师事务所

11105

专利代理师金玉洁

(51)Int.Cl.

G06V10/82(2022.01)权利要求书2页说明书15页附图6页

(54)发明名称

学习统一嵌入的方法和装置

(57)摘要

描述了一种用于在数据处理装置上使用神

经网络生成统一机器学习模型的计算机实施的

方法。该方法包括数据处理装置为多个对象顶点

中的每一个确定相应学习目标。数据处理装置基

于神经网络的两个或更多个嵌入输出来确定相

应学习目标。该方法还包括数据处理装置训练神

经网络以识别与多个对象顶点中的每一个相关

联的数据。数据处理装置使用相应学习目标并基

于第一损失函数来训练神经网络。数据处理装置

使用经训练的神经网络来生成统一机器学习模

型，其中该模型被配置为识别与多个对象顶点中

的每一个相关联的特定数据项。

CN120298851A权利要求书1/2页

1.一种在数据处理装置上的计算机实现的方法，用于使用多个神经网络生成用于音频

信号数据或数字图像中的对象识别的统一机器学习计算模型，所述方法包括:

由数据处理装置并为所述多个神经网络确定多个对象顶点中的每一个的相应的学习

目标，所述多个神经网络中的每一个是专用机器学习模型，其中，每个对象顶点定义对象的

不同类别，并且其中，所述多个对象顶点中的每一个的相应的学习目标对应于来自以数字

图像或音频信号数据作为输入的相应的专用机器学习模型的第一嵌入输出，每个机器学习

模型基于第一损失函数来训练，其中，所述第一嵌入输出包括用于音频信号数据或数字图

像中的对象识别的特征向量；

其特征在于:

由数据处理装置并使用所述多个神经网络生成统一机器学习模型，所述统一机器学习

模型被配置为生成用于识别所述多个对象顶点中的对象的第二嵌入输出，包括：

将所述多个对象顶点中的一个或多个添加到对象顶点的组中；

由数据处理装置基于第二损失函数和作为输入的音频信号数据或数字图像来训练

(200)神经网络，以针对所述输入生成类似于与所述组中的对象顶点的学习目标相对应的

第一嵌入输出的第二嵌入输出；以及

在保持准确度阈值水平的同时，或者直到所有对象顶点都已经被处理:

将所述多个对象顶点中的另外一个或多个添加到所述对象顶点的组中；

重复训练(200)。

2.根据权利要求1所述的方法，其中，确定神经网络的相应的学习目标进一步包括:

响应于训练，由数据处理装置生成两个或更多个嵌入输出，其中，每个嵌入输出指示特

定的学习目标，并且包括对应于与特定对象顶点相关联的数据的参数向量；以及

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

CN120298851A 学习统一嵌入的方法和装置（谷歌有限责任公司）.pdfVIP