- 1
- 0
- 约2.44万字
- 约 20页
- 2024-03-20 发布于四川
- 举报
本申请属于自然语言处理技术领域,涉及基于人工智能的语料收集方法、装置、设备及存储介质。该方法包括获取用户输入的配置项信息,所述配置项信息包括目标视频关键字和视频网站;从所述视频网站下载通过检索所述目标视频关键字得到的目标视频的视频数据,所述视频数据包括视频文件和SRT字幕文件;从视频文件中分离出音频文件,并将SRT字幕文件解析出来的字幕文本内容拆分成字幕块;根据每个字幕块的分段时间切分音频文件,获得分段音频;建立分段音频和字幕块之间的关联;对关联后的分段音频和字幕块按照预设筛选关键词进行分类筛选
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号CN110008378A
(43)申请公布日
2019.07.12
(21)申请号20191
您可能关注的文档
最近下载
- 《db44t402.1-2007-燃气热水器(给)排气管》.pdf VIP
- 5、灰色色母MSDS 物质安全表.pdf VIP
- 2020.2021一汽大众全新迈腾维修手册电路图 正时链条装配.pdf VIP
- (2025)西宁市入团考试精选题库(含答案).docx VIP
- 2026年陕西省铜川市政府采购评审专家考试真题(带答案).docx VIP
- 《铁路轨道维护》课件——更换道岔基本轨作业.pptx VIP
- 深圳市工务署参考品牌库(2021.12).docx VIP
- QC-T 656-2023汽车空调用空气调节装置总成.pdf VIP
- 肌少症膳食营养处方及运动干预中国专家共识(2025)解读PPT课件.pptx VIP
- 南京信息工程大学《大学物理》期末试卷a卷.pdf VIP
原创力文档

文档评论(0)