- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精品文档,助力人生,欢迎关注小编!
超声检查报告语音录入系统
【摘要】文章介绍了一种基于超声诊断仪的超声检查报告语音录入系统。系统选用迅速发展的汉语语音识别技术完成从录入员手动输入检查报告到语音输入的转变,实现医师自己一个人完成超声检查。对大量超声检查诊断描述及结论进行总结分析,提出按属性实现超声检查诊断描述的方法,提高了超声检查报告的规范度。针对目前数字化医院的报告系统在人机交互中无法有效地快速录入、超声检查描述规范度较低、系统操作相对复杂、检索过程效率低的现状,研发设计了一种服务于超声检查的语音录入系统。
【关键词】语音录入;超声检查报告;超声诊断病例描述
1.引言
数字化医院已经成为世界上先进医院的重要组成部分[1,2,3,4,5],是信息技术迅速发展对医院医疗和管理工作全方位渗透而提出的新概念。以现有信息技术为基础,提高医疗信息的高度共享,实现全方位的人机交互,提高医疗效率、医疗质量和管理水平是当今医疗技术的前进方向之一。
语音作为人类最重要、最有效、最常用和最方便的交换信息的形式,让计算机能够听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。语音识别技术作为该系统实现的核心技术,贯穿于整个系统的操作过程,选用语音增强技术、端点检测技术作为语音识别的前端处理技术,基于数据驱动的特征提取技术和基于子空间的建模方法,实现其孤立词识别,其识别率高达95%,在汉语普通话孤立词识别上为国际领先水平。
由于国内还没有相关产品,医院采用一台超声诊断仪配一名录入员人工输入超声检查报告的方法,存储超声图像,运用电子病历管理病人检查结果。该设计结合超声诊断学知识、多媒体技术、数据库知识、计算机技术、语音识别技术等多;学科跨领域实现超声检查报告的语音录入,无需配备录入员。通过多位有经验的超声检查医师对超声检查的超声描述及超声结论等信息整理总结并参考相关书籍[6],经过一定的积累设计出一套适用于大多数疾病描述情况的模板。本模板灵活度高,集多位权威医生的经验积累,规范度高,涵盖范围广,提
高了超声检查报告的质量。考虑超声检查医生的工作方式及检查流程,选用分布式的系统架构提供了高效的执行效率和简便易用的操作方法。实现同数字医院应用系统的整合工作,使智能语音处理技术适配于目前的HIS(Hospital Information System,医院信息系统)。
2.语音识别技术
语音识别技术正直接与医疗卫生、办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理,工业生产部门的语音控制,电信的自动拨号系统、辅助控制和查询以及福利事业的生活支援系统各种实际应用领域相接轨,并终将成为既触摸屏之后新一代操作系统和应用程序的操作方式。
作为整个系统的核心技术,语音识别技术贯穿系统的整个工作过程。本系统的语音识别技术由三部分组成:稳健的前端处理系统、基于数据驱动的特征提取技术和基于子空间的建模方法。
稳健的前端处理系统包括解码器、语音增强模块和端点检测模块。解码器对常见的语音格式如WAV、MP3、WMA、OGG、APE等构建对应的解码器,转变成下一步计算机能够识别的文件格式。考虑到超声检查报告语音录入系统的工作环境为封闭带混响和噪声的情况,选用语音增强模块用于抑制语音噪声和混响,提升语音有用信息的可懂度,选用频域维纳滤波算法[7,8]完成,该算法适用于环境噪声较大的情况,较大程度上去除了噪声信号,并增强了有用信号。端点检测作为语音识别的必要环节,用于区分语音信号和非语音信号,选用一种基于倒谱距离语音端点检测的改进算法[9,10],其抗噪性好,具有良好的鲁棒性,标记出语音和非语音的时间索引,以便对语音信号进行识别,且该处理会提高语音识别的识别率。
语音识别的本质是统计模式识别,统计模式识别分为特征提取、模式匹配和参考模式库等三个基本单元。语音识别研究的一个重要进展,就是算法从模式匹配技术转向基于统计模型的技术。传统的特征提取方法有线性预测倒谱系数和感知线性预测等。但是传统的特征提取方法往往是基于某种生理发声模型,或者人耳的听感知模型,并且这种生理模型的建模方法取得了很大的成功,并主导了语音识别方法近半个世纪,但对实际应用还需不断改进。基于数据驱动的特征提取技术作为正在发展的前沿技术,其提取有用信息的思路与数据密切相关,根据识别任务,构建基于子空间的隐马尔可夫模型。考虑到子空间模型可分为对识别有益的子空间和对识别无益的子空间,前者称为语音内容子空间,后者称为无用分量子空间或信道子空间,通过类似于主成分分析法,分离出信道子空间的基,并对特征进行变换,去除特征在信道子空间的部分,从而使特征更有利于孤立词识别系统。该方法是让数据自我反应特点,通过数据的自我表述,能更加突
文档评论(0)