- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 信息社会语音应用契机 * 应用举例(嵌入式设备) * 应用举例(嵌入式设备) * Apple iPod Player * 应用举例(车载设备) * 应用举例(电信和企业) * 这门学科发展和应用已日益成熟,学习这门课程具有重要的现实意义 * 这门学科发展和应用已日益成熟,学习这门课程具有重要的现实意义 * * 如果不使用语言,而是单单使用某种信号来进行信息传递,要表示一个新的想法或是将某个事件进行组合并表示出来都是不可能的。 姿态是最不发达的传递信息的方法。用姿态可以表示“走”这一状态。可是要表示“今天将家里的狗赶走了”,“我打算明天走”,“想像 走时候的情景”等使用“走”这个词的地方很多,但是这些信息如果不用语言都无法表达。即使对“中午我吃的是羊肉串”这种简单的事件,如果不用语言也是无法表达的。此外,如“没发生什么事情”,“没有起床”这种具有否定含义的信息不用语言更加无法表达的。 * annotation注解, 注释Routine [计] 例行程序 * articulation[n] 说话, 表达, 清晰度Analog cassette模拟处理单元time scale [计] 时标 * 杜德雷 * 贝尔实验室的语言演示器VODER,那是最原始的语言合成器,问它一个问题,在一位女秘书操作下,它就说出回答 * 动态时间规正(DTW)方法是一种常用的校验算法,在非线性时间对齐的基础上给出两个签名间的距离并进行判决,这样做经验的成份较多,缺乏统计基础 * TTS的全称为Text To Speech,即“从文本到语音”。它是同时运用语言学和心理学的杰出之作,在内置芯片的支持之下,通过神经网络的设计,把文字智能地转化为自然语音流。 音频编码有GSM、LPC-10、G.711、G.723.1、G.729 语音编码方法归纳起来可以分成三大类:波形编码、信源编码、混合编码。 MPEG4中码激励线性预测CELP(code excited linear predictive)音频编码器 多带激励(MBE)模型 corpus [n] 文集, 本金 trainable [adj] 可训练的 * 美国国防部高等研究计划局(DARPA) * SPHINX系统,美国卡内基梅隆大学著名的语音识别系统,早期的版本的设计者就是当代IT行业的知名人物——GOOGLE研究院的李开复博士 * SPHINX系统,美国卡内基梅隆大学著名的语音识别系统,早期的版本的设计者就是当代IT行业的知名人物——GOOGLE研究院的李开复博士 * 压缩代码指压缩编码的方法,例如1代表PCM * 盲人使用的上网软件包(阳光软件) * 1、语音信号的表示方式 2、语音信号的特点 3、TTS表示。。 * 80年代以来– 近代语音处理技术 ? 语音编码技术 – 1980年2.4kb/s LPC-10 – 1988年4.8kb/sCELP标准FS-1016,16kb/s REAL编码标准(欧洲) – 90年代2.4kb/s MBE – G系列Model Based Vocoder ? 语音合成 – 1980年Klatt 串/并联共振峰合成器 – 基于规则和波形拼接的合成--TD-PSOLA语音合成 – 基于统计大语料库的合成--Corpus based 语音合成方法 – Trainable TTS – HMM based 语音合成方法 * 80年代以来–近代语音处理技术 ? 语音识别 – 基于HMM框架的统计模式识别算法发展与工程化 – 80年代中期开始美国DARPA委托NIST组织的一系列评测,对语音识别研究发展重要的影响 – 语音处理技术产品化热潮 ? 1985年开始IBM大词汇英语听写机Tangora ? 90年代初Dragon Dictate70000词识别系统 ? 1988年无限词汇的中文听写机研制成功 – 90年代初开始 ? CMU的Sphinx非特定人连续语音识别系统 ? 1997年IBM推出的中文ViaVoice ? VLSI和计算机技术发展带来的巨大推动 * 二、语音处理的发展历史(国内) 在国内,语音处理方面有代表性的研究单位有:清华大学、中国科学院声学所、西安电子科技大学、四达公司、中国科学院自动化所、微软中国研究院等。 国内有关语音技术的产品分为两大类:语音合成技术和语音识别技术。 * 二、语音处理的发展历史(国内) 我国语音处理研究的起步比先进国家晚一点,但在跟踪国外先进技术基础上,进步很快。尤其在语音识别方面,成果突出,如研制成功汉语听写机产品。这是因为,由于汉语音节种类较少,结构很规则,便于以音节为基础实现无限词汇识别,因而很快获得了可与国际先进水平相比拟的成果。在语音合成方面,有限词汇的语音合成器已在自动报时、报警、
您可能关注的文档
- 幼儿园因病缺勤追查制度.doc
- 幼儿园音乐教育期末考试复习资料.doc
- 幼儿园园长培训如何开好各类家长会.ppt
- 幼儿园月工作重点.doc
- 幼儿园运动中提高幼儿自我保护能力的研究.doc
- 幼儿园中班社会活动教案 我会用筷子.doc
- 幼儿园中班下学期班级工作计划-班级工作计划.doc
- 幼儿园中班语言期末试卷.doc
- 幼儿园中班语言学科教学计划.doc
- 幼儿园中班主题《鼻子和气味》之动物鼻子的功能.doc
- 第十一章 电流和电路专题特训二 实物图与电路图的互画 教学设计 2024-2025学年鲁科版物理九年级上册.docx
- 人教版七年级上册信息技术6.3加工音频素材 教学设计.docx
- 5.1自然地理环境的整体性 说课教案 (1).docx
- 4.1 夯实法治基础 教学设计-2023-2024学年统编版九年级道德与法治上册.docx
- 3.1 光的色彩 颜色 电子教案 2023-2024学年苏科版为了八年级上学期.docx
- 小学体育与健康 四年级下册健康教育 教案.docx
- 2024-2025学年初中数学九年级下册北京课改版(2024)教学设计合集.docx
- 2024-2025学年初中科学七年级下册浙教版(2024)教学设计合集.docx
- 2024-2025学年小学信息技术(信息科技)六年级下册浙摄影版(2013)教学设计合集.docx
- 2024-2025学年小学美术二年级下册人美版(常锐伦、欧京海)教学设计合集.docx
最近下载
- 江苏省扬州市扬州中学2023-2024学年高一上学期12月月考数学试题(含答案解析).docx
- 2024年国家电网招聘之财务会计类题库附参考答案(轻巧夺冠).docx
- 恶性肿瘤放疗患者营养治疗专家共识解读PPT课件【31页】.pptx VIP
- 江苏省海门市高一上学期期末考试(数学).doc
- PowerVision臻迪无人机PowerEgg用户手册.pdf
- 蓝海华腾变频器说明书.pdf
- 幼儿园小班家访记录表.pdf
- 江苏省扬州市邗江中学2019-2020学年高一上学期期中数学试题(解析版).pdf VIP
- 第一讲数字集成电路质量评价.ppt
- 辽宁省沈阳市浑南区2022-2023学年九年级上学期10月月考物理试题(含答案).pdf VIP
文档评论(0)