- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于MFCC和神经阵列网络的声纹识别系统.doc
基于MFCC和神经阵列网络的声纹识别系统
基于MFCC和神经阵列网络的声纹识别系统
nbsp;(作者第一、第二、第三)
学校、学院nbsp; 省份nbsp; 市nbsp; 邮编nbsp; 2、学校、学院nbsp; 省份nbsp; 市nbsp; 邮编)
摘要:说话人识别是一门热门学科,研究说话人识别所采用的方法也有很多种。本文采用流行的梅尔倒谱系数和神经网络来构建说话人识别系统。基于人的听觉特征的MFCC参数,能够很好反映基于发音生理特征的基音轮廓以及基音周期变化率。人工神经网络具有很好的灵活性和可扩充性,可以模拟任何非线性系统,尤其对非特定人的识别上,可以从大量语音数据中训练出特定人的语音模型。实验表明:本文使用的说话人识别模型,系统的识别率可以达到96%以上,具有很好的识别效果。
关键词:说话人识别、Mel倒谱系数、神经阵列网络
Speaker Recogniton Based on
MFCC and Neural Network Array
nbsp;(English:作者第一、第二、第三)
nbsp;(1学校、学院nbsp; 省份nbsp; 市nbsp; 邮编nbsp; 2、学校、学院nbsp; 省份nbsp; 市nbsp; 邮编)
Abstract:Speaker Recognition is a popular subject,also many speaker recognition methods are used . In this paper, the popular Mel cepstrum coefficients and neural networks are used to build a speaker recognition system. Characteristics of human hearing based on MFCC parameters, can better reflect the characteristics of pitch based on sound physiological profile and the rate of change of pitch period. Neural network has good flexibility and scalability, can simulate any nonlinear system, especially in the recognition of non-specific people, the specific people’s voice model can also be extracted from a large number of voice data. Experiments show that: This article uses the speaker recognition model, The recognition rate can reach 96% With good recognition.
Key Words: speaker recognition, Mel Cepstrum coefficient, Neural array Network
1 前言
nbsp;nbsp; 声纹识别在我国的研究和应用的时间比较短,但其重要性得到了广泛的关注,目前我国政法系统中开展司法语音实验室的已达25个单位。随着计算机技术和通讯技术的迅猛发展,人们交流的方式也产生了很大的变化,从移动电话到网上视频,甚至现在的3G技术。这些技术不但方便了人们的生活,也使得犯罪分子有了更新的犯罪工具和手段,而且有更大的隐蔽性,使得在案件的侦破和抓捕过程变得更加的困难。而且现在随着手机录音功能的普及,更多的人能够更加容易的获取录音资料。在这种情况下,进行声纹识别是非常有的意义,也必将在司法领域发挥越来越重要的作用。但同时也要认识到:声纹识别是一项综合性的、难度很大的新兴技术,从声音中提取满意的特征信息就是一项复杂的任务,如何提高说话人识别的准确性和快捷性更是一个难题,因此,研究实用可靠的声纹识别系统,具有很好的应用前景。
nbsp;此外,声纹识别和各种通信技术结合的越来越紧密,如将说话人识别与数据库结合起来,形成公安户籍语音登记库,可以通过犯罪现场录音迅速找到犯罪嫌疑人,加速案件的侦破速度。与程控交换技术结合起来,准确的识别电话交谈中通话人的身份,从而对重点目标人进行搜索和监控,为侦查破安和审理案件提供证据。与网络技术结合起来,通过高速计算机技术,网络警察在网上巡游,可以找到网上诈骗和犯罪团伙的视频通话,预防犯罪行为。随着计算机、通讯技术与声纹识别技术结合的越来越紧
您可能关注的文档
- 基于CPLD的帧转移面阵CCD驱动电路的设计.doc
- 基于CPLD的彩灯控制器设计毕业设计正文.doc
- 基于CPLD的出租车计费器课程设计论文.doc
- 基于C俄罗斯方块课程设计报告.doc
- 基于CS的人事综合管理系统的设计与实现.doc
- 基于CVSD编码的无线语音系统方案的设计.doc
- 基于c实现的校友录管理系统课程设计.doc
- 基于C的Windows应用程序设计课程标准.doc
- 基于C的企业人事管理系统的设计与实现毕业论文.doc
- 基于C拼图游戏的设计与实现论文.doc
- 第十一章 电流和电路专题特训二 实物图与电路图的互画 教学设计 2024-2025学年鲁科版物理九年级上册.docx
- 人教版七年级上册信息技术6.3加工音频素材 教学设计.docx
- 5.1自然地理环境的整体性 说课教案 (1).docx
- 4.1 夯实法治基础 教学设计-2023-2024学年统编版九年级道德与法治上册.docx
- 3.1 光的色彩 颜色 电子教案 2023-2024学年苏科版为了八年级上学期.docx
- 小学体育与健康 四年级下册健康教育 教案.docx
- 2024-2025学年初中数学九年级下册北京课改版(2024)教学设计合集.docx
- 2024-2025学年初中科学七年级下册浙教版(2024)教学设计合集.docx
- 2024-2025学年小学信息技术(信息科技)六年级下册浙摄影版(2013)教学设计合集.docx
- 2024-2025学年小学美术二年级下册人美版(常锐伦、欧京海)教学设计合集.docx
最近下载
- 2018-2019学年辽宁省本溪市实验中学八年级(上)第一次月考物理试卷(附答案详解).docx
- 3.大功率激电测深工作方法.pdf
- 权吉浩-《长短的组合》原版五线谱钢琴谱正谱.pdf
- 消毒供应中心管理.pptx
- 2020~2021学年第一学期期末考试九年级历史试卷.pdf VIP
- 埃斯顿pronert伺服驱动器说明书.pdf
- EPC工程总承包项目管理办法.docx
- JTT 1504.1-2024 公路基础设施长期性能科学观测网 第1部分:建设规范.docx
- 在线网课学习课堂《高级医学英语(首都医大 )》单元测试考核答案.pdf
- 2020-2021学年广州市白云区九年级上学期期末数学试卷(含答案解析).docx
文档评论(0)