- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 111462758 A
(43)申请公布日
2020.07.28
(21)申请号 202010136440.5
(22)申请日 2020.03.02
(71)申请人 深圳壹账通智能科技有限公司
地址 518052 广东省深圳市前海深港合作
区前湾一路A栋201室
(72)发明人 熊玮
(74)专利代理机构 北京市京大律师事务所
11321
代理人 刘挽澜
(51)Int.Cl.
G10L 17/02(2013.01)
G10L 17/08(2013.01)
G10L 17/00(2013.01)
权利要求书2页 说明书14页 附图3页
(54)发明名称
智能会议角色分类的方法、装置、设备及存
储介质
(57)摘要
本发明涉及人工智能领域,公开了一种智能
会议角色分类的方法、装置、设备及存储介质,能
够便捷而有效地进行多人会议场景的语音角色
分离。本发明方法包括:对会议音频数据进行分
割获得多个候选音频数据,多个候选音频数据中
的每个候选音频数据对应包括一个编号;对多个
候选音频数据中的每个候选音频数据分别进行
断点识别,获得目标时间节点;根据目标时间节
点从多个候选音频数据中截取预设时段的第一
音频数据和第二音频数据;分别对第一音频数据
和第二音频数据进行特征参数提取,获得第一特
A 征参数和第二特征参数;将第一特征参数和第二
8 特征参数进行说话人对比分析,获得目标特征参
5
7
2 数;根据预置的角色数据库和编号确定目标特征
6
4
1 参数对应的目标角色。
1
1
N
C
CN 111462758 A 权 利 要 求 书 1/2页
1.一种智能会议角色分类的方法,其特征在于,包括:
获取会议音频数据,并对所述会议音频数据进行分割获得多个候选音频数据,所述多
个候选音频数据中的每个候选音频数据对应包括一个编号;
对所述多个候选音频数据中的每个候选音频数据分别进行断点识别,获得目标时间节
点;
根据所述目标时间节点从所述多个候选音频数据中截取预设时段的第一音频数据和
第二音频数据;
分别对所述第一音频数据和所述第二音频数据进行特征参数提取,获得第一特征参数
和第二特征参数;
将所述第一特征参数和所述第二特征参数进行说话人对比分析,获得目标特征参数;
根据预置的角色数据库和所述编号确定所述目标特征参数对应的目标角色。
2.根据权利要求1所述的智能会议角色分类的方法,其特征在于,所述对所述多个候选
音频数据中的每个候选音频数据分别进行断点识别,获得目标时间节点,包括:
分别对所述每个候选音频数据进行重要点检测,获得分段数量;
根据所述分段数量对所述多个候选音频数据进行分段,得到分段数据,并获取所述分
段数据对应的音频曲线的转折点;
获取所述转折点的左侧相邻点和右侧相邻点;
根据所述转折点计算第一斜率和第二斜率,所述第一斜率为所述转折点与所述左侧相
邻点连线的斜率,所述第二斜率为所述转折点与所述右侧相邻点连线的斜率;
计算所述第一斜率与所述第二斜率的差值;
将所述差值大于第一预设阈值的转折点作为所述多个候选音频数据中的目标时间节
点。
3.根据权利要求2所述的智能会议角色分类的方法,其特征在于,所述根据所述目标时
间节点从所述多个候选音频数据中截取预设时段的第一音频数据和第二音频数据,包括:
将所述目标时间节点作为末端时间点,根据所述末端时间点从所述多个
文档评论(0)