OCR 分析报告.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
OCR定义 OCR(Optical Character Recognition)即光学字符识别,是指电子设备(如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法 将形状翻译成计算机文字的过程:即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率, 是OCR最重要的课题,衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。 目前项目使用需求 项目名称:吉凯随访系统; 项目甲方:吉凯基因技术有限公司;。 需求目标:吉凯随访系统中规划的OCR技术需求范围:利用OCR技术功能模块,解析用户所上传的病历文档图片(包含病历、医嘱、检查、检验等文书),将图片转换为计算机可识别的文字语言;根据转换的结果进行分析、统计等应用; 对所建议开发的软件基本要求如下: 病例图片文字识别; 识别率90%以上,识别时间小于10分钟; 输出病例相关内容,需要按照病例格式输出,否则无法判断最终结果; 患者上传相关病例文档图片,上传之后后台识别反馈结果给患者或者医生。; 数据词库自己训练,需要程序自动带有学习功能; 开发周期两个月。 现状 目前市面上OCR技术应用于医疗行业的APP及软件如下: 汉王OCR(PC端软件): 汉王OCR是一个带有?PDF?文件处理功能的?OCR?软件;具有识别正确率高,识别速度快的特点。有批量处理功能,避免了单页处理的麻烦;支持处理灰度、彩色、黑白三种色彩的BMP、TIF、JPG、PDF多种格式的图像文件;可识别简体、繁体和英文三种语言;具有简单易用的表格识别功能;具有TXT、RTF、HTM和XLS多种输出格式,并有所见即所得的版面还原功能。新增打开与识别PDF文件功能,支持文字型PDF的直接转换和图像型PDF的OCR识别,既可以采用OCR的方式将PDF文件转换为可编辑文档,也可以采用格式转换的方式直接转换文字型PDF文件为RTF文件或文本文件; 实际测试汉王OCR后发现其受图片质量、图片格式、图片灰度、图片大小等因素影响,实际对于病历文档的识别率不到30%,不能满足项目需求; 但其可接受定制化需求,定制化需要额外付费,初步估计在10W以上一个病历模板,目前病历的模板种类数量非常大,项目成本将无法预估; 易道博识 北京易道博识科技有限公司(简称“易道博识”)成立于2013年,由来自中科院、清华大学、北京大学的多名顶尖的模式识别专家共同组建。创始人朱军民获得了国家科技进步二等奖等多项业界成就。核心技术包括:3D人脸识别、银行表单识别、增值税发票识别、支票识别、各类证照识别、一维码识别、二维码识别、联机手写识别等。 实际测试该公司OCR产品后发现其OCR对于证件识别率较高,但达不到90%。识别病历图片的准确率达不到20%。但其可接受定制化需求,定制化需要额外付费,基础功能起步价10W,病历模板定制10W一个。项目成本无法预估。 泰比(ABBYY) 泰比(ABBYY)是一个在文档转换、数据捕获和语言软件领域领先的供应商。泰比(ABBYY)研究和发展的关键领域包括文档识别技术及应用语言学。 泰比(ABBYY)的识别技术和产品为人们越来越多的资料信息提供了强有力的工具,使他们能够:从纸张和图像上获得信息,自动获取数据,处理和存储有用的信息。利用识别和数据采集产品,人们能够在数据输入方面节省大量的金钱和精力,并能以一种更新和更有效的方式来获取信息和资料。我们的语言产品帮助打破语言障碍,促进交流和沟通变得更容易和更清晰。 经过电话咨询,该公司主要专注于产品的研发,如有需要定制费用相当之昂贵,具体价格没有提供。 捷速OCR 捷速OCR文字识别软件:是一款可以直接识别文字,将图像转化成文字的工具。很多时候我们需要一款软件能够直接把扫描文件上面的文字的变成直接可以编辑的文字,这样我们工作就方便很多了,可以直接使用扫描仪扫描书籍和相关的文档,然后使用捷速扫描文字识别软件,就可以编辑这些文字,能够节省我们办公人员很多的时间,这些软件特别是对那些处理文档的人员和相关的从事编辑行业的人员特别适用,可以广泛的应用,并且软件识别正确率高,可以批量的转换扫描的文件。 实际测试该公司OCR对图片文字识别率较高,识别率50%左右。识别病历图片的准确率达不到30%。但其可接受定制化需求,定制化需要额外付费,基础功能起步价3W,病历模板定制价格没有具体给出。项目成本无法预估。 百度云OCR文字识别企业版、云识别、LEADTOOLS等等其它OCR产品价格都比较昂贵。 医疗行业OCR类型APP 易随诊:病例识别时间需要一天左右,识别率90%左右,后台人工识别校正。 拍医拍:病例识别时间10分钟左右,识别率90

文档评论(0)

139****7971 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档