- 0
- 0
- 约1.1万字
- 约 19页
- 2025-06-09 发布于湖北
- 举报
CRNN街景字符编码识别系统的实现
摘要
随着人工智能发展,这项技术也走入了我们平常人的生活中,随着人工智能的热度越来越高,特别是近几年的自动驾驶技术十分火热,其中对于真实世界信息的获取显得十分重要。为此本文从街景字符识别入手主要内容包括以下几个部分:
(1)介绍了当前街景字符识别的研究现状,分析了对此问题进行研究的意义。
(2)本设计采用CRNN网络进行街景字符识别,设计并训练出了可用的验证模型,并对其中详细的网络结构构成及采用该结构的原因进行了详细说明,对所训练模型的网络结构详细参数进行了详细的说明,针对性解决了传统CNN网络识别街景字符识别时输入输出需为定长值的问题。
(3)针对模型易用性,开发了可更换模型的图形化软件,降低了相应模型的使用门槛,对个人学习、测试人员的工作提供了便利,降低了公司的开发成本。同时也对对软件的模块构成,使用流程,界面效果进行了详细说明。
关键词:机器学习;街景字符识别;字符识别;CRNN
目录
TOC\o1-4\h\z\u第一章绪论 1
1.1课题研究背景 1
1.2课题研究意义 1
1.3课题研究现状 2
1.4课题的研究工作及安排 2
第二章开发环境与主要技术框架 4
2.1开发与运行环境 4
2.2技术开发框架 4
2.3训练集与数据集 5
2.4本章小结 6
第三章CRNN街景字符编码识别系统实现 7
3.1CRNN网络结构 7
3.1.1卷积层 8
3.1.3循环层 9
3.1.4转录层 10
3.2模型训练 11
3.3图形界面 11
第四章CRNN系统实现结果及其性能分析 13
4.1系统结构 13
4.1.1输入输出模块 13
4.1.2图像识别模块 15
4.2模型性能分析 16
第五章总结与展望 19
5.1总结 19
5.2展望 19
参考文献 20
PAGE1
PAGE1
PAGE2
第一章绪论
1.1课题研究背景
近几年来,随着计算机行业的软件和硬件的不断发展,特别是人工智能方向的硬件基础得到了极大的提升,使得人工智能方向的技术得到了发展。同时随着智能产品的普及,拍摄和获取图像难度大幅度降低,图像的精准度也得到了提升,甚至已经出现了搭载1亿像素摄像头的量产手机。这些推动使得人们更加想要去获取图像中所包含的信息,这一需求使得计算机图像处理技术飞速发展。
OCR识别技术是计算机视觉不可或缺的组成部分,其主要目的是从图像中提取出图像中的文字信息。这项技术在现实生活中已经有了较为广泛的应用,如实名认证中的身份证上传的识别,停车场的车牌号识别等等。现在已经有不少大型的云服务提供商在提供图像的检测和识别的服务,这些服务商,既包括了我们耳熟能详的阿里云,腾讯云,亚马逊等也包括不少小公司。
1.2课题研究意义
随着人工智能的发展,自动驾驶技术走进了人们的视野,甚至现在已经有不少厂商向消费者提供了L2级别的自动驾驶功能。要实现自动驾驶,对于从摄像头中获取相应的信息显得极为重要,如道路的标线,路面的指示信息,指示牌的信息等。这些信息共同为自动驾驶的模型提供信息,使得自动驾驶功能能安全的运行。但对于普通的测试人员来说,对深度学习的工具应用不及相应的专业开发人员,对于测试人员来说,如果相应的知识不足,则会对相应模型或者服务的测试产生困难。本设计提供了一个简单易用的街景字符识别软件,可以对模型进行验证及测试,同时本设计提供了一个简单易用的界面,使得所有的人员都可以较为简单的上手。本设计还具有拓展性,支持更换加载不同的训练好的模型,使得所有人员都可以在第一时间对模型进行验证,提高了开发效率。在为相应专业的人员提供方便。同时本设计还可作为教学用软件,对于较为简单的网络提供了可视化训练的界面,可以对网络的结构、训练过程的参数、准确率等参数进行显示,使较为生涩难懂的网络结构,以及基本原理变得生动易懂。可更换加载的模型的设计使得学生可以在图形化的界面下,清楚的检查自己训练的模型的好坏,给教学带来了便利。根据我前期对市场上的调研显示,与本设计相似的软件大多都是面向专业人员,对于教育层面的关注没有本设计那么重视。综上本设计还是具有相应的研究意义。
1.3课题研究现状
OCR识别相关研究最早出现上个世纪90年代中期,经过几十年的研究发展,识别从最开始的严格要求识别的图像和文字极为苛刻,到任意倾斜程度的文字的识别,再到完成对光照不均匀,部分字符遮挡,复杂背景,有透视变换等复杂的图像中文字的识别。其中得益于深度学习技术的发展,OCR的识别精准度有了显著的提高和对图像的要求也得到了降低。
在传统的文本
您可能关注的文档
- 《天润乳业公司营运资金管理问题及完善对策研究任务书1100字》.docx
- 《天润乳业公司营运资金管理问题分析开题报告文献综述(含提纲)4000字》.docx
- 《福建三钢企业薪酬管理问题研究(任务书+开题报告)2800字》.doc
- 《萍乡钢铁税务筹划现状及问题的调研分析报告4000字》.doc
- 《天润乳业公司物流信息化升级问题及完善对策研究开题报告(含提纲)3000字》.doc
- 《景德镇陶瓷集团财务管理问题及对策分析7100字》.doc
- 《天润乳业公司营运资金管理问题及完善对策研究开题报告3700字》.docx
- 《雅戈尔纺织公司绩效考核存在的问题及对策研究8600字》.doc
- 《雅戈尔纺织公司成本管理问题研究(论文任务书)1900字》.docx
- 《金融科技时代工商银行的业务创新与数字化转型14000字(论文)》.doc
最近下载
- 河北广谋新材料科技有限公司年产600万平方米复合革及隔音布、400万平方米新型复合网项目环境影响报告表.docx VIP
- 部编版语文五年级下册第七单元教材解读大单元集体备课.pptx VIP
- 部编版语文五年级下册第六单元教材解读大单元集体备课.pptx VIP
- 部编版语文五年级下册第五单元教材解读大单元集体备课.pptx VIP
- 部编版语文五年级下册第四单元教材解读大单元集体备课.pptx VIP
- 部编版语文五年级下册第三单元教材解读大单元集体备课.pptx VIP
- 部编版语文五年级下册第二单元教材解读大单元集体备课.pptx VIP
- 部编版语文五年级下册第一单元教材解读大单元集体备课.pptx VIP
- 车工 (数控车床)理论知识考核要素细目表四级.pdf VIP
- 本科课程《基础护理学》教案,第十二章给药.doc VIP
原创力文档

文档评论(0)