- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SpeechSDK开发中英文混合朗读程序
基于Speech SDK开发中英文混合朗读程序
1 Speech SDK简介
语音识别(SR)和语音合成(TTS)一直是计算机应用的热点,如果你想在Windows平台上开发具有语音识别和语音合成功能的应用程序,使用Microsoft Speech SDK是较好的选择。现在许多应用程序的语音识别和语音合成部分,例如金山词霸,就是在此基础上开发的。
Microsoft Speech SDK是微软公司推出的支持语音应用程序开发的工具包,其最新版本是5.1,可以在微软的网站免费下载,如果要支持中文,还要下载相应的Language Pack。下载后先安装Speech SDK,再安装简体中文语言包,这样你的计算机就具有中英文语音能力了。
下面介绍在Visual C++6.0中如何利用Speech SDK开发中英文全文朗读的程序。
2 SpVoice类介绍
SpVoice类是支持语音合成(TTS)的核心类。通过SpVoice对象调用TTS引擎,从而实现朗读功能。 SpVoice类有以下主要属性:
Voice:表示发音类型,相当于进行朗读的人,包括Microsoft Mary,Microsoft Mike,Microsoft Sam和Microsoft Simplified Chinese四种。其中前三种只能读英文,最后一种可以读中文,也可以读英文,但对于英文单词只能将其包括的各个字母逐一朗读出来。下面的程序中我们将会想办法解决这个问题。
Rate:语音朗读速度,取值范围为-10到+10。数值越大,速度越快。
Volume:音量,取值范围为0到100。数值越大,音量越大。
SpVoice有以下主要方法:
Speak:完成将文本信息转换为语音并按照指定的参数进行朗读,该方法有Text和Flags两个参数,分别指定要朗读的文本和朗读方式(同步或异步等)。
Pause:暂停使用该对象的所有朗读进程。该方法没有参数。
Resume:恢复该对象所对应的被暂停的朗读进程。该方法没有参数。
3 建立工程并导入类型库
建立一个名字为mytts的MFC AppWizard(exe) 工程,在step1里面选择Dialog Based,在step2里面把Automation选项勾上。 其它的选默认值。
查找 spai.dll,将其拷贝到工程的res 目录,打开 MFC ClassWizard,选择 Automation 页,单击按钮Add Class…,选择From a type library…,选中sapi.dll文件,这时系统会出现 confirm Classes 对话框,询问将要导入的类,我们全部选中。
4 增加控件
给对话框IDD_MYTTS_DIALOG增加控件,结果如图1所示。
图1 程序界面
5 编写代码
这里只说明关键的代码,完整代码可参考源文件。
1) 对话框的初始化
这里主要完成语音对象的速度,音量等基本参数的设置。
BOOL CMyttsDlg::OnInitDialog()
{ ……
CLSIDFromProgID(LSAPI.SpVoice,CLSID_ SpVoice);
voice.CreateDispatch(CLSID_SpVoice); //创建一个对象
pDisp = voice.m_lpDispatch;
HRESULT hr = pDisp-QueryInterface(CLSID_SpVoice,(void**)voice.m_lpDispatch);
if (hr == S_OK) { pDisp-Release();}
else { voice.AttachDispatch(pDisp,TRUE);} //关联对象与接口
voice.SetRate(0);//设置速度
voice.SetVolume(100);//设置音量
voiceList=voice.GetVoices(NULL,NULL); //读取语音列表:
……
m_Text=你好How are you;//设置要阅读的初始文本
UpdateData(FALSE);
……
}
2) 阅读按钮的代码
这部分代码是本程序的核心,主要解决的问题是实现中英文引擎的实时切换。实现方法是这样:依次处理文本中的每个字符,判断该字符的中英文类型,若其类型与前面的字符一致,继续处理后面的字符。直到发现一个字符与前面字符的类型不一致时,将前面的字符读出来(当然要根据字符类型设置相
原创力文档


文档评论(0)