- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
?
?
设计企业中成品图纸利用方法研究
?
?
章喻龙
(中国电力工程顾问集团中南电力设计院有限公司,湖北 武汉 430070)
研究显示,新的工程图纸中有超过80%的设计可以通过重用或者修改过去的设计来实现[1]。然而事实上,作为企业知识财富核心的图纸却只会有极少部分被再次利用。其主要原因在于设计人员通常只能通过同事间的口耳相传以及在档案馆对图纸逐一查询的方式来获取图纸信息,在短时间内获取所需图纸的可能性较低。因而如何提升成品图纸的利用率进而提升设计企业生产效率成为一个亟待解决的关键问题。文章提出可以通过分三步走的方式来提升图纸利用效率。首先搭建多维度的图纸搜索平台;然后使用机器学习算法将图纸中非结构化数据转化为结构化数据存储,用于提升图纸搜索质量;最后搭建图纸辅助和自动化设计平台变被动搜索为主动推荐,进一步提升绘图效率和质量。
1 多维度图纸搜索平台搭建
根据公司信息化建设水平,设计企业可以依次搭建数字档案馆、项目门户和电子成品档案借阅3个模块,从多个维度对图纸进行展示和利用。
1.1 数字档案馆
数字档案馆模块通过结构化数据的形式记录所有归档图纸的整编信息,例如归档时间、所属项目、绘制专业和设计人等,进而提供对已归档图纸基于项目基础信息的检索和借阅功能。
1.2 项目门户
项目门户模块如图1所示,以项目地图的形式对项目进行展示。通过选择项目是属于境内还是境外、其所属省份、工程类别(如火电、新能源、电网)以及项目类型(如总承包、设计、勘测)等信息,设计人员可以找到需要的项目的名称和其详细信息,点击项目详情还可以进一步的关联到项目的流程、参与人员名单、涉及专业、差错统计情况以及校审意见等信息,并从上述维度查询到对应图纸。
图1 项目地图
项目门户模块的数据主要来源于项目从登记开始到立项、启动、WBS分解、卷册任务书下达、成品校审、成品出版最后到归档的全套流程,是对数字档案馆模块的补充。
1.3 基于搜索引擎的电子成品档案借阅
电子成品档案借阅模块[2]如图2所示,是一个基于Lucene索引技术的图纸搜索引擎。该模块提供了图纸全文检索和标签检索的功能,方便设计人员对图纸进行借阅和查询。
图2 电子成品档案借阅界面图
图纸的全文检索功能通过三个步骤实现:首先通过一个在AutoCAD上二次开发的文字提取软件提取DWG上的所有文字信息;然后利用爬虫软件搜集这些信息并发送到索引服务器;最后索引服务器利用分词工具包对文字进行分词并制作索引。
标签式检索功能则是首先从流程中获取图纸的设计阶段、所属专业以及工程类别等信息;然后通过索引服务器把相关信息制作为图纸标签;最后通过流程引擎的标签选择界面实现图纸按照标签进行查询的能力。
2 深度学习算法提升搜索质量
2.1 挖掘图纸潜在信息
提升图纸搜索能力,首先需要挖掘图纸中的潜在信息。近年来人工智能技术高速发展,利用深度学习算法实现的文字和图像识别算法可以有效的提取图纸信息,提升搜索质量。
2.1.1 文字识别
文字识别是指对包含文字的图像文件进行分析处理从而获取文本的过程。该过程一般包括图像输入,图像预处理、文字检测和文本识别四个步骤[3-4]。
基于开源的通用文本识别工具对于机打、位置相对固定的文字的识别率很高,然而却存在不善于处理特殊字符识以及不定方向文字的问题[3],因而无法直接应用于实际的生产环境。因此需要首先利用包含标注了定位信息的图纸对文字检测程序进行训练,提升文字检测程序的准确度和识别效率;然后再将定位的文本进行分割后发送给文本识别算法进行转换,从而实现对图纸中文字的识别功能。
文字识别算法可以用于识别图签关键信息、图纸标注以及对全部文字进行识别。其中图签关键信息包括图签中填写的项目名称、项目编号、卷册编号、图纸名称、图纸编号、设计时间、比例、版本、设计人员姓名、校审人员姓名等信息。图纸标注信息包括图元的标注信息(如门窗的大小、型号等)以及其他图纸内容的说明。全文字识别是指对图纸当中所有文本进行识别的技术,识别后信息通常用于PDF图纸的全文检索。
2.1.2 图像识别
较为常见的图像识别技术有图像分类、目标检测和实例分割等。近年来,开源的基于深度学习的图像识别算法例如VGG16、Faster RCNN,YOLO等,因为其易得性、高正确率和近乎实时的识别效率而被较为广泛的应用在各个生产系统当中[5-6]。
深度学习的算法实现的图像识别功能的主要难点在于需要大量被标记的图纸。获取被标记的图纸可以通过利用图纸和项目信息中的结构化数据的关联关系,使用计算机程序自动化标注的方法实现。例如可以通过数据库中图纸和设计人员关联,设计人员又和其所属专业关联的特性,将图纸和其专业进行关联,从而实现对图纸所属专业的自动化标注工作。还有部分训练数据可以通过开源项目获得,例如DICE项目[7]就提
原创力文档


文档评论(0)