基于人工智能的语料收集方法、装置、设备及存储介质.pdfVIP

  • 1
  • 0
  • 约2.44万字
  • 约 20页
  • 2024-03-20 发布于四川
  • 举报

基于人工智能的语料收集方法、装置、设备及存储介质.pdf

本申请属于自然语言处理技术领域,涉及基于人工智能的语料收集方法、装置、设备及存储介质。该方法包括获取用户输入的配置项信息,所述配置项信息包括目标视频关键字和视频网站;从所述视频网站下载通过检索所述目标视频关键字得到的目标视频的视频数据,所述视频数据包括视频文件和SRT字幕文件;从视频文件中分离出音频文件,并将SRT字幕文件解析出来的字幕文本内容拆分成字幕块;根据每个字幕块的分段时间切分音频文件,获得分段音频;建立分段音频和字幕块之间的关联;对关联后的分段音频和字幕块按照预设筛选关键词进行分类筛选

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号CN110008378A

(43)申请公布日

2019.07.12

(21)申请号20191

文档评论(0)

1亿VIP精品文档

相关文档