- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
基于卷积神经网络的甲骨文字识别研究
摘要
甲骨文是中国已发现的古代文字中年代最早、体系较为完整的文字,不仅对研究汉
字起源有巨大的帮助,同时对我国的历史研究和文化传承也极具深远意义。甲骨文识别
任务是对甲骨文的字符类别进行确定,它是完成甲骨文数字化研究的前提条件。近些年
来,随着深度学习的迅速发展,卷积神经网络在目标检测、图像识别等领域取得了优异
的成果,这为甲骨文识别工作提供了全新的思路。但是,由于甲骨片上文字均为殷商时
期人工雕刻,且在地下深埋年代久远,因此在甲骨文领域当中还存在着较多的,诸如字
形相近、数据样本分布不均、字形残缺、背景噪声严重等有待解决的问题和挑战。针对
该领域当中存在的主要问题,本文进行了深入的研究,提出了两种有效的模型算法,较
好地提高了甲骨文识别精度。
第一,针对当前拓片甲骨文字的识别方法存在局部细节特征提取能力弱,对部分高
相似度的甲骨文字识别率较低的问题,提出了一种基于改进ResNeSt网络的甲骨文字识
别方法。首先,本文首次将ResNeSt网络模型引入到甲骨文字识别研究当中,并且在此
基础上设计了跳转连接结构,逐步将网络浅层特征向网络深层传递并进行融合,提高网
络模型捕捉局部细节的能力;同时结合甲骨文字“长条形”的特点,引入坐标注意力机制
模块,从宽度和高度两个方向上对所得特征进行加权融合,以此获得更多有用的特征信
息;最后通过去掉网络最后一层的激活函数和全连接层以及对最后一个卷积层输出通道
数的重新设置,对网络分类器进行了有效优化,以此提高识别过程中模型对有效特征的
利用。
第二,针对当前小样本甲骨文字识别方法需要依赖大规模未标注数据集来学习相应
笔划特征,无法利用现有少量标注样本直接进行分类模型训练的问题,引入了目前先进
的小样本图像分类框架EASY,其中结合了多种优秀且有效的训练技巧,可以直接使用
少量带标签样本训练识别模型。然后针对现有方法小样本的条件下,网络学习到的特征
有限,从而导致识别效果差的问题,在EASY框架的基础上,将监督对比学习的思想引
入到模型训练中来,将输入图片进行数据增强后输入特征提取网络,然后提出联合对比
损失来对网络进行优化和参数学习,使特征空间中类内特征向量距离更近,类间特征向
量距离更远,骨干网络获得了更加充足的特征,最终实现分类效果的提升。
关键词:甲骨文字识别;ResNeSt网络;坐标注意力机制;小样本学习;监督对比学习
基于卷积神经网络的甲骨文字识别研究
ABSTRACT
OracleboneinscriptionsaretheearliestandmostcompleteancientChinesecharacters
discoveredinChina.TheynotonlyprovidegreathelpinstudyingtheoriginofChinese
characters,butalsohaveprofoundsignificanceforChinesehistoricalresearchandcultural
inheritance.Thetaskoforaclebonerecognitionistodeterminethecharactercategoriesof
oracleboneinscriptions,whichisaprerequisiteforcompletingthedigitizationresearchof
oracleboneinscriptions.Inrecentyears,withtherapiddevelopmentofdeeplearning,
convolutionalneuralnetworkshaveachievedexcellentresultsin
文档评论(0)