- 1
- 0
- 约1.97万字
- 约 17页
- 2023-05-05 发布于四川
- 举报
本发明公开了一种粤语唇读识别方法、设备以及存储介质,方法包括获取第一粤语视频片段;裁剪第一粤语视频片段中的无用片段,得到第二粤语视频片段;划分第二粤语视频片段中的视频序列和音频序列,对音频序列进行分词并生成分词时间戳,根据分词和分词时间戳生成标签;提取视频序列中的人脸图像,并过滤不完整的人脸图像,根据过滤后的人脸图像和标签生成样本图像;根据样本图像训练预设的粤语唇读识别模型,得到训练完成的粤语唇读识别模型;根据训练完成的粤语唇读识别模型识别目标视频序列,得到识别结果。本方法能够采集粤语单词级的唇
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114299418 A
(43)申请公布日 2022.04.08
(21)申请号 202111507949.7
(22)申请日 2021.12.10
(71)申请人 湘潭
原创力文档

文档评论(0)