- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
小议自动识别和信息采集技术
信息网络是现代物流的核心,当各项仓储物流设备由机械化/人工化进入自动化阶段时,如何处理设备与系统的连接及实物与信息的对应成了软件系统需要解决的问题。这就是采用AIDC(自动识别与数据采集)技术的必要性。随着计算机技术的普及及网络技术的应用,自动识别技术日益受到人们的重视自动识别与数据采集技术(AIDC)主要解决的问题是实物与信息之间的匹配关系,使实物的运输、仓储过程,可以即时的反映到信息网络环境中,使操作者能够迅速了解物流的全部过程,尤其是在途的情况,提高物流过程的作业效率及货物数量的准确性。数据采集、自动录入和快速处理等功能于一体的新兴信息技术。它最早产生在二十年代,诞生于Westinghouse的实验室里。条码是由一组按预先规定编码规则和有关技术标准排列的条、空符号,用以表示一定的字符、数字及符号组成的信息。条码系统是由条码符号设计、制作及扫描阅读组成的自动识别系统。条码是一种数据载体,它在信息传输过程中起着重要作用, 如果条码出问题,物品信息的通讯将被中断。现代化物流业运用最为广泛、有效。条码技术是物流信息系统的关键节点和物流信息由手工处理到数字化、自动化的桥梁,可以说没有条码技术就无法建立真正的物流信息系统。条形码技术有以下特点:
(1)简单。条码符号制作容易,扫描操作简单易行。
(2)信息采集速度快。普通计算机键盘录入速度是200字符/分钟,而利用条码扫描的录入信息的速度是键盘录入的20倍。
(3)采集信息量大。利用条码扫描,依次可以采集几十位字符的信息,而且可以通过选择不同码制的条码增加字符密度,使采集的信息量成倍增加。
(4)可靠性强。键盘录入数据,误码率为三百分之一,利用光学字符识别技术,误码率约为万分之一。而采用条码扫描录入方式,误码率仅为百万分之一,首读率可达98%以上。
(5)灵活、使用。条码符号作为一种识别手段可以单独使用,也可以和有关设备组成识别系统实现自动化识别,还可以和其他控制设备联系起来实现整个系统的自动化管理。同时,在没有自动识别设备时,也可以实现手工键盘输入。
(6)自由度大。识别装置与条码标签相对位置的自由度要比光学字符识别(OCR)大得多。
(7)设备结构简单、成本低。条码符号识别设备的结构简单,容易操作,无须专门训练。与其它自动化技术相比,推广应用条码技术所需费用较低。光学字符识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。OCR的概念是在1929年由德国科学家Tausheck最先提出来的,后来美国科学家Handel也提出了利用技术对文字进行识别的想法。OCR软件主要是由下面几个部分组成。
图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式,目前有OpenCV,CxImage等开源项目 。二值化:对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的,更好的识别文字,我们需要先对彩色图进行处理,使图片只前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图了。
噪声去除:对于不同的文档,我们对噪声的定义可以不同,根据噪声的特征进行去噪,就叫做噪声去除
倾斜较正:由于一般用户,在拍照文档时,都比较随意,因此拍照出来的图片不可避免的产生倾斜,这就需要文字识别软件进行较正。
版面分析:将文档图片分段落,分行的过程就叫做版面分析,由于实际文档的多样性,复杂性,因此,目前还没有一个固定的,最优的切割模型。
字符切割:由于拍照条件的限制,经常造成字符粘连,断笔,因此极大限制了识别系统的性能,这就需要文字识别软件有字符切割功能。
字符识别:比较早有模板匹配,后来以特征提取为主,由于文字的位移,笔画的粗细,断笔,粘连,旋转等因素的影响,极大影响特征的提取的难度。
版面恢复:人们希望识别后的文字,仍然像原文档图片那样排列着,段落不变,位置不变,顺序不变的输出到word文档,pdf文档等,这一过程就叫做版面恢复。
后处理、校对:根据特定的语言上下文的关系,对识别结果进行较正,就是后处理。磁卡是一种磁记录介质卡片。它由高强度、耐高温的塑料或纸质涂覆塑料制成,能防潮、耐磨且有一定的柔韧性,携带方便、使用较为稳定可靠。通常,磁卡的一面印刷有说明提示性信息,如插卡方向;另一面则有磁层或磁条,具有2-3个磁道以记录有关信息数据。磁条能否正常进行读磁、写磁主要与电磁性能有密切
文档评论(0)