说话人识别技术在网络视听内容监管中的应用.pdfVIP

下载本文档

2
0
约1.1万字
约 4页
2017-07-16 发布于湖北
举报
版权申诉

说话人识别技术在网络视听内容监管中的应用.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

说话人识别技术在网络视听内容监管中的应用.pdf

Video Audio 视音频技术说话人识别技术在网络视听内容监管中的应用文/国家新闻出版广电总局573台高志恒两类：一类基于高斯混合模型，另一虽然上述两种模式都能极大提类基于支持向量模型。高说话人识别的速度，但是这两种模摘要：本文结合网络视听内然而，常见的说话人识别技术尚式仍然是一种线性时间复杂度的算法，容监管业务，提出了一种基于度无法直接应用于网络视听内容的监管当候选模型达到几十万或者上百万时，量空间聚类的说话人识别技术应中，其原因有以下两点。其计算所需时间也随之急剧增加。用思路，并搭建了追踪系统进行（1）开放域识别此外，非线性时间复杂度说话人验证。面向网络视听内容的说话人识别识别技术方面，最常用的技术为基于度属于开放域识别问题，不同于传统受量空间索引的技术 [3,4] ，该技术通过在关键词：网络视听内容监管限领域的说话人识别，网络视听内容高维空间对模型建立索引结构，如树索说话人识别度量空间体量大、来源广泛、更新快，任何在引、VA-File 索引等，来提高识别的视听内容中出现的说话人都是可能的实际效率。但是大多数度量空间索引技候选说话人，基本可认为是一个开放术都只能利用数据之间的相对距离和三 1 引言域说话人识别问题。角不等式进行空间的过滤，由于维数灾不同于传统广播电视视听内容的（2）效率难的存在，当空间维数很高时，度量空监管，互联网视听内容具有体量大、来常见的说话人识别技术无法解决间索引技术带来的速度提升比较有限，源广泛、传播速度快、生命周期短、内开放域识别面临的效率问题。常见的这也是该技术的一个显著瓶颈。容良莠不齐等特点，大大增加了监管基于高斯混合模型或基于支持向量模综上所述，常见的说话人识别技难度。在网络视听内容的日常监管中，型的说话人识别在得分计算时，仍采术在应对网络视听内容监管领域的说监管部门往往需要监测视听内容中是用似然得分计算方式，说话人识别系话人识别、跟踪问题时，无法解决其否存在违规（涉毒、涉黄等）的相关统的时间复杂度与候选模型的个数基效率瓶颈问题，需要结合任务进行具内容，传统的人工监听监看方式显然本呈线性关系，随着待监管数据的增体研究。难以应对海量网络视听内容监管的挑加，其计算量也急剧增加，严重影响战。说话人识别是一种根据音频特征系统的实际应用效果。 3 基于度量空间聚类的对特定说话人进行认证、识别、追踪针对大规模开放域的说话人识说话人识别方法的技术，利用该技术可以在网络视听别速度问题，有人已经把“特征对模 3.1 技术路线内容中自动判断是否存在特定人的音型似然得分”的识别模式转换到“模