- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
广播监测语音综合处理系统的方案的设计
广播监测语音综合处理系统的方案的设计
摘 要:随着我国广播事业的不断发展,对广播监测的要求也在不断提高,工作量也越来越大,依靠原有人工识别为主的工作模式已经无法满足现在的业务需求。广播监测网语音综合处理系统的建设很好地解决了这一问题,将监测工作从人工识别向计算机识别发展,提高了语言和节目的识别率,从而提高了广播监测的工作效率。
关键词:广播语音综合处理;语音评估;语种识别;呼号识别
1 需求概述
随着我国广播事业的不断发展,目前广播监测工作量越来越大,如何自动监测和评估这些节目的播出信号质量,以及及时地判断这些节目是否存在空播、错播、停播等异态事件,已经成为我们必须解决的一个现实问题。
目前,广播监测的手段正在由传统依靠人工操作向计算机辅助监测过渡,初步达到了设备控制的自动化和广播信号采集的数字化、信息化和网络化,并实现了部分简单异态事件监测的自动化。在广播监测中,其中一种方式是依靠无人值守的遥控站点采集当地实时收听到的节目,并以录音文件的形式回传到中心机房进行评估,这种主要依靠人工识别的监测方法,在站点数量众多时,需要处理的工作量非常大,人工很难在较短时间内发现并确认汇总异态。近年来广播监测业务规模不断扩大,对监测质量的要求也不断提高,建设一套智能化的广播语音综合处理系统,提高对异态处理的实效性和准确性,对于提高广播监测服务质量和维护空中电波秩序具有非常重要的意义。
2 建设内容
广播监测网语音综合处理系统的核心功能是监测服务区内听众听到的节目是否与播出时节目源的节目和语言一致,如果不一致,确认信号的可听度、干扰强度、及语言等,为此需要完成基于录音文件的自动评估、实时语音语种识别、台名与呼号辅助识别三个主要功能,具体建设内容包括:
2.1 基于录音文件的自动评估
对站点采集的各频次语音数据进行自动评估,输出判断结果及其置信度。其中:
(1)质量评估结果:停播、错播和空播;(2)效果评估结果:评分结果为5分制,其中3分以上直接打分3/4/5,3分以下给出s1/s2形式评分(s1:广播台可听度0~5渐强,s2:干扰情况0~5渐弱),并判断噪声种类(背景噪声或同邻频语音干扰)和干扰强度;(3)语种评估结果:在错播异态条件下,且s2在3分以下时,自动给出错播语种的候选结果及其置信度。
2.2 实时语音语种识别
针对实时采集的数据文件,应能够判断是否按照预定的语言进行播出。如果没有按照预定语言播出,则进行报警,并显示应当播出的语种、实际播出的语种等信息。
2.3 台名与呼号辅助识别
可以对站点采集到的含有外台台名及呼号的录音文件进行台名与呼号识别。
3 设计原则
考虑到综合处理系统具有监测数据处理量大,实时性强,对数据安全性、可靠性、准确性要求高的特点,并结合现有网络传输条件,确定以下设计原则:
(1)可靠性:系统能够长时间稳定运行,设备监测指标准确,信息上报处理迅速,达到系统的最大平均无故障时间;(2)先进性:采用先进的音频智能处理技术,提高处理的准确性和实时性,而且充分考虑到未来技术发展的需要,力争超前设计;(3)安全性:建立在一个专用网络中,注重信息和数据的保护与隔离,可保证广播监测网系统的安全,具有完善、可靠的系统访问权限机制;(4)模块化:系统采用模块化设计和面向服务的构架,当监测任务增加、监测站点增加和网络规模扩大时,通过增加相应的功能模块,就能方便地扩大监测规模;(5)开放性:采用开放式操作系统、开放式网络结构及其协议、和开放式的客户/服务器模式,从而实现充分的资源共享,使平台具有良好的可移植性。
4 系统软硬件设计
4.1 物理结构设计
(1)录音任务下发与回传服务器:该服务器已到位,负责遥控站录音文件的采集和回收;(2)卫星参考源采集服务器:负责卫星参考源信号的实时采集存储;(3)数据库服务器:负责存储数据和结果信息,是业务层交互信息的核心存储区;(4)Web服务器:负责系统页面的展示;(5)调度服务器:负责数据处理任务的调度,并负责处理结果的回收入库,负责负载均衡控制,以充分利用计算机集群的计算能力;(6)引擎计算服务器:负责实时对调度器下发的任务进行音频比对计算,并把计算结果通知调度器;(7)同步服务器:负责运行图的实时同步,和数据库信息的同步;(8)磁盘阵列:负责存储录音文件和参考源数据。
各个服务器均可为主流机架式计算机物理部署,服务器之间通过千兆局域网互连。用户业务系统在基于J2EE的Web服务器管理下,实现多用户并发数据访问。
4.2 软件架构设计
广播监测网语音综合处理系统的软件架构采用模块化设计原则,每个模块保持一定的功能独立性,在协同工作时,通过相互之间的接口完
原创力文档


文档评论(0)