- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
出口成IBMViaVoice语音输入系统详解科技时代新浪网
目前汉字输入的方式主要有四种:键盘输入,手写输入,扫描输入和我们现在要谈到的语音输入。让我们先来了解一下这四种输入方式。
键盘输入:键盘输入基本上是基于各种输入法,主要又分为字形输入法和拼音输入法。实际上字形输入法是不符合人的写作思维习惯,因为人们在措辞时,头脑中首先反映出的是即将这个词语的语音,所以字形输入法更适合专业录入人员使用。拼音输入法也分两种,一种以词语为输入单位,另一种以语句为输入单位,而后者不符合写作的思维习惯,因为人们在写作时是以词为思考单位。键盘输入法在输入速度有要求的情况下对于键盘操作、指法要求比较高;
手写输入:手写输入是最容易上手的输入方法,但是同样由于手写输入的先天不足,很难达到较高的输入速度;
扫描输入:扫描输入对于硬件要求比较高,主要是适用于资料的整理;
语音输入:语音输入对输入人员的键盘操作能力、指法要求很低,几乎可以说你只要会说汉语,就可以进行语音输入。
语音输入尤其是汉字语音输入经历了很长时间的研究和应用,到目前已经达到了一个相当的高度,所以为了让更多的人、更多不是非常熟悉电脑的人来使用电脑进行汉字输入,我把多年以来使用IBM VIAVOICE语音输入系统的心得体会写下来,使得语音输入这种新的汉字输入方法能得到更广泛的应用。
语音输入是基于语音模型的一种输入方法,涉及大量运算,所以它对CPU和内存有一定的要求,CPU频率越高、内存越大,语音输入就能更好地工作。不过也不需要太担心这个问题,我使用的CPU是赛扬433,内存96MB,基本上能很好的进行语音输入。自然,我们还需要一个耳麦。通过使用IBM VIAVOICE,我们发现这个系统对于耳麦要求并不高,我所用的就是十块钱买来的耳麦,当然性能良好的耳麦对于语音输入也有很大的帮助。
安装完IBM VIAVOICE后,系统会默认增加一个自启动项—IBM VIAVOICE语音中心,我们可以在“开始”—“程序”菜单找到它,另外在菜单中我们还可以看到一个IBM VIAVOICE文件夹。(见图1)
图1
一、新建用户,建立自己的语音模型 第一次打开ViaVoice时会出现以下界面。(如图2)
图2
相应的设置很简单,每个界面都有详细的说明,后面的操作按照提示可以一路点“下一步”完成即可。(如图3、4)
图3
图4
完成以上操作之后,进入麦克风设置完毕后,出现以下界面。下面我们要为自己建立语音模型,这对我们之后的语音输入效果非常重要。(如图5)
图5
语音模型的建立共有五个阶段:
1.在图5中选择“下一步”,这时会出现一个文本框,提示你读出文本框中所列出的一段话。读完后,系统会进行语音训练,训练完毕后,最简单的语音模型就建立完毕了,当然可以想像得到,这样轻松建立起来的模型效果并不是很好。然后你会看到如下界面。(如图6)
图6
四个部分的训练内容中A是最基本的,四个部分总共有500多句话,全部训练完需要两个多小时,所以要是想一劳永逸,嗓子可是要受罪,我试过,口干舌燥的,但是就我使用感觉来看,经过A部分的训练,已经可以进行基本的使用了,所以大家可以化整为零,免得一下子说伤了,失去兴趣。IBM ViaVoice系统有自行学习的功能,所以使用时间越长,识别率越高!如同歌里唱的:越来越好,来来来……
到此,个人用户(语音模型)建立完毕,我们可以正式开始使用语音输入了。二、语音输入
启动IBM ViaVoice语音中心,在屏幕上方会出现一个工具条。(如图7)
图7
在正式输入前,需要进行音频设置。(如图8)
图8
这也是影响输入效果一个至关重要的因素,出现的界面是我们提到过的图3、4及随后的带有提示的对话框,因为前边已经做过,不再累述。建议在设置完以后,最好不要改动你带耳麦的方式,以保证麦克风相对嘴的位置保持不变,如输入过程中曾经摘下、挪动过耳麦,建议最好重新进行音频设置,当然可以视输入效果是否明显变化而定。
音频设置完毕后,进入用户选项,点击ViaVoice选项。(如图9)
图9通过“用户名”下拉菜单选择相应的用户。(如图10)
图10
其中“语音”、“听写”、“直接听写”和“纠错”涉及一些比较高级的设置,推荐使用默认设置,不要改动,当使用比较熟练后可以做相应调整。(如图11)
图11
这两项工作(音频设置和用户选项)做好以后,单击工具栏上的麦克风图标,图标变为绿色时,就可以开始正常工作了。(如图12)
图12这个时候,你就要出言谨慎了,你所说的每一句话系统可能都有反应,你可以对它说:“帮助”,它会调出帮助内容;你可以说“关闭”,它会关闭当前的任务;你打哈欠,它会显示“没听清您说什么,能再说一遍吗?”;你说“格式化”,……(没有反应,开玩笑的)
文档评论(0)