小程序实现语音识别转文字,坑路历程.pdfVIP

小程序实现语音识别转文字,坑路历程.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

小程序实现语音识别转文字,坑路历程采样率与编码码率限制

最近为小程序增强语音识别转文字的功能,坑路不断,特此记录。

每种采样率有对应的编码码率范围有效值,设置不合法的采样率或编

码码率会导致录音失败。具体看这个

微信开发者工具

开发者工具上的录音文件与移动端格式不同,临时只可在工具上举行播

ecorder/RecorderManager.start.html

放调试,无法挺直播放或者在客户端上播放

一开头没有留意,导致录音不胜利。

debug的时候发觉,工具上录音的路径是,客户端

上录音是wxfile://xxx.mp3。忽悠呢,不是格式不同,是映射路径不

试过几次后,采纳这样的配置,感觉录音识别率和体积之间比较好平

同。

衡:

其实做个兼容也不难,每次提醒一行文字,很丑。

1

第1页共7页

录音优化

2

由于可能误按,于是对小于500ms的录音挺直忽视。

3

另外,松开录音按键后,再延迟一点时光才真正stop录音。

sampleRate:16000,//采样率

录音文件格式

numberOfChannels:1,//录音通道数

微信录音文件支持mp3和aac。这2种格式文件都比较小,aac文件体

encodeBitRate:96000,//编码码率积更小。这对上传来说是件好事情,速度更快。

单通道基本是必选的。由于asr只支持单通道。frameSize也是可以的,但是对语音识别转文字就不友好了。由于百度、阿里云ASR、讯飞的

但是要考虑截断对识别的影响。临时没实用上。语音转文字接口都不支持aac和mp3,通常要求是pcm或者wav格式。

第2页共7页

假如微信录音能提供wav格式,那么就不用服务器做格式转换了,但是javaProcessBuilder要用法数组传参

wav格式体积是mp3、aac的5到10倍,起码短期是没戏了,这也是无

数人吐槽的地方。转换音视频,习惯用ffmpeg。安装完ffmpeg之后,用java新建进程

调用。

服务器转换录音文件格式

文档评论(0)

189****0737 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档