- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博士论文答辩 报告主要内容 语音信号处理的领域—语音识别 起源于上个世纪五十年代 七十年代初—Itakura(日本)提出DTW(Dynamic Time Warping), CMU—Hearsay-II,Harpy 八十年代初—矢量量化技术(Vector Quantization),HMM(Hidden Markov Model)—把声学-语言学-句法等统计知识集中在一个统一框架中,CMU—SPHINX系统,采用VQ/HMM 九十年代—ANN(Artificial Neural Network), ANN和HMM相结合,1997,IBM-Viavoice 语音信号处理的领域—语音合成 起源:1835年由W.von Kempelen发明,经威斯顿改进的机械式的会讲话的机器。 20世纪70年代末TTS(Text to Speech)——用最基本的语音单元(如音节或半音节)作为合成单元,通过拼接进行合成 80年代,D.Klatt设计的串/并联混合型共振峰合成器 ,可以产生七种不同音色的语音,包括模拟不同年龄、性别和个性的说话人的语音 90年代末,日本的研究者提出了一种多样本、不等长语音拼接合成技术PSOLA,在语音库中存放了大量的真人语音样本,通过选择合适的拼接语音片段来实现高质量的合成语音。 目前,语音合成产品具有很高的可懂度,自然度还不尽人意 语音信号处理的领域—语音编码 起源于1939年Dudley发明的声码器 20世纪70年代起,国外开始研究计算机网络上的语音通信,当时主要是基于ARPANET网络平台进行的研究和实验,线性预测编码LPC,数码率3.5kb/s 80年代的研究主要集中在局域网上的语音通信,因为带宽可达Mb/s量级的价格较为低廉的以太网的出现,英国剑桥大学于1982年在10Mb/s的剑桥环形网上进行,LPC-10,数码率2.4kb/s 90年代,随着Internet在全球范围内的兴起和语音编码技术的发展,IP分组语音通信技术获得了突破性的进展和实际应用,最初在网络游戏等软件包中传送和存储语音信息,90年代中期开始,实现局域网内PC间的语音通信以及经PBX和外界电话的通信,VoIP(IP电话) G.723.1,G.729等,有的算法最低数码率可达 1.2kb/s以下 语音信号处理的领域—说话人识别 起源:在第二次世界大战期间,美国国防部向贝尔实验室提出的课题。 说话人识别研究的早期工作,主要集中在人耳听辨实验方面。 话者识别技术按其识别任务可以分为两类:话者辨认(Speaker Identification)和话者确认(Speaker Verification)。 根据识别对象的不同,还可将话者识别分为三类,即与文本有关(Text–Dependent)、与文本无关(Text-Independent)和文本提示型(Text-Prompted)。 ATT应用说话人识别技术研制出了智慧卡,已应用于自动提款机。欧洲电信联盟于1998年完成了CAVE计划,在电信网上进行说话人识别。 海湾战争,萨达姆讲话 语音信号处理的领域—其他 音频信息检索-多媒体,哼唱检索,广告监播 语音训练与校正—计算机辅助语言学习(Computer-Aided Language Learning,简称CALL) 语种识别(Language Identification)-应用于多语言语音识别的前端处理 基于语音的情感处理研究 嵌入式的语音识别技术 语音信号处理的应用 语音识别技术 声控应用 :声控电话转换、声控语音拨号系统、声控智能玩具、信息网络查询、家庭服务、宾馆服务、旅行社服务系统、医疗服务、银行服务、股票查询服务、工业控制等 听写机 :声控打字机 自动口语翻译 :将口语识别技术、机器翻译技术、语音合成技术等结合,可将一种语言输入的语音翻译为另一种语言的语音输出,实现跨语言的交流 广播新闻的自动文摘技术、自动誊写技术 语音信号处理的应用 说话人识别技术 安全加密、银行信息电话查询服务 公安机关破案和法庭取证 语音合成技术 公共交通中的自动报站、各种场合的自动报时、自动告警、电话自动查询服务、文本校对中的语音提示等 电信声讯服务领域的智能电话查询系统 ,查询一些动态信息,如股票、成绩、节目、热点问题、机场、车站、购物、市场、售后服务等信息 用于基于微型机的办公、教学、娱乐等智能多媒体软件,如文稿校对、语音学习(帮助外国人、残疾人、儿童等学习语言)、语音秘书、语音书籍、教学软件、语音玩具等。 文本朗读,有声新闻,语音合成技术与机器翻译技术相结合,可以实现语音翻译;与图像技术相结合,可以输出视觉语音(visual speech) 语音信号处理的应用 语音编码技术 语音通信数字化:数字通信系统、
您可能关注的文档
- 法律知识开性探究入世后民商事案件裁判文书公.doc
- 法律知识趋势探究证券业和其它金融行业混业监管.doc
- 法律知识思考关于制定中国民法典.doc
- 法律知识思考浅谈有关劳动权.doc
- 法律知识题中权利冲突几个理论问.doc
- 法律知识完善探究社会主义市场经济法治秩序建立和.doc
- 法律知识研究宪法人权保障机制.doc
- 法律知识制度浅议申诉复查听证.doc
- 犯罪工具没收研究.doc
- 非给付型非给付型不当得利证明责任辨析应用.doc
- 资金使用效率优化,避免预算执行中的资源浪费.docx
- 2025中医医师定期考核专业理论知识考试卷库(560题)附答案.docx
- 2025年湖北宜昌市事业单位 人才引进招聘533人笔试模拟试题参考答案详解.docx
- 2025年湖北宜昌市教育系统事业单位校园专项招聘47人笔试模拟试题及答案详解一套.docx
- 全密度聚乙烯生产线项目实施方案(模板).docx
- 2025年湖北宜昌市事业单位 人才引进招聘533人笔试模拟试题附答案详解.docx
- 综合性评价在核心素养导向下的作文教学应用.docx
- 光伏钢桁架生产项目初步设计(模板范文).docx
- 外研版2024四年级上册英语Unit 2 第1课时 Start up 课件.pptx
- 2025年湖北宜昌市事业单位 人才引进招聘533人笔试模拟试题及参考答案详解.docx
文档评论(0)