- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国书法字识别算法的运用研究.doc
中国书法字识别算法的运用研究----书法论文
--第1章绪论
1.1课题背景
中华民族五千年文明以及丰富的文字记载都己为世人所认可,在这一璀璨的历史长河中,中国的书法艺术以独特的艺术形式和语言再现了这一嬗变过程。伴随着数字化技术的飞速发展,中国书法得以通过数字化的形式保存和共享,以一种新的形式展现在人们的面前。数字化的发展,也使得越来越多的资源和力量投入到数字化资源应用技术研宄上来。目前,在针对数字化的书法字应用中,有许多书法字图像处理与检索方面的研究,但书法字识别方面的研究相对较少。
1.2研究意义
本文以CADAL数字图书馆中中国书法系统所建设的书法字图像库为基础,开展了中国书法字识别算法的研究,提出了基于检索的书法字识别算法。首先利用本文提出的基于LSH的大规模书法字图像快速精确检索算法对待识别书法字进行快速精确的相似性检索,为了同时保障速度和准确率,该算法分为基于LSH的书法字图像快速检索和基于形状特征的书法字图像精确检索两部分;然后再根据检索出的相似书法字图像的语义标注信息计算权重,从而给出识别结果。
……………
第2章相关研究综述
2.1手写体识别
在联机手写体识别中,用户通过触摸屏、手写板等输入设备,将字的图像逐笔输入,系统可以根据每一个笔画的类型、顺序以及运笔的速度变化等特征来对输入的字进行判断和识别。由于笔顺信息通常将作为该方法的一个重要识别特征,所以在一般笔顺正确的情况下,该方法识别旳准确率很高,但是当输入笔顺错误时,准确率会急剧下降。脱机识别首先由扫描仪、照相机等光电设备将字符转化为图像,然后由计算机进行识别,根据识别对象的不同可分为脱机手写体识别和脱机印刷体识别。目前联机手写汉字的识别和脱机印刷体汉字的识别技术己经日趋成熟,并广泛应用于人们日常生活中,如支持手写输入的、PDA等。历史书法作品中书法字的识别属于脱机手写体汉字识别的一种。对脱机手写体识别有许多研究成果,王建平等人[8]提出了一种基于变精度粗糖集的脱机手写体汉字识别方法,将汉字样本及其对应的特征向量作为一个信息系统,构建脱机手写体汉字识别的决策信息系统,此外,肖春景等人19]于2010年提出了一种基于小波包隐马尔可夫的脱机手写体签名识别方法。
2.2书法字检索与识别
2008年俞凯等人119]提出了一种书法字识别方法,该方法是建立在书法字检索的基础之上,首先采用其在文献[11]中提出的书法字骨架相似性检索方法,检索出数据库中与待识别书法字图像相似的书法字图像,然后根据检索到的相似书法字图像在数据库中的语义标注,给出识别结果。实验对300个书法字样本进行了测试,识别率达96.3%。该方法是建立在检索的基础上的,识别时间取决于检索出数据库中相似书法字所需要的时间,当数据库较大时,该识别方法的时间效率?很低。此外,Shi等人在2003年提出了一种基于部首分解的脱机书法字识别方法。
…………………
第3章基于LSH的大规模书法字图像快速精确检索…………13
3.1总体概述………13
3.2基于LSH的书法字图像快速检索算法…………14
3.3基于形状特征的书法字图像精确检索…………19
3.3.1上下文轮廓特征和SIFT特征提取…………19
3.3.2相似性度量方法…………20
3.4实验及结果分析…………22
3.4.1基于LSH检索算法的最优值选取…………23
3.4.2不同形状特征和相似性度量方法检索结果比较………25
3.5本章小结.....................27
第4章基于检索的书法字识别.............28
4.1总体概述…………….28
4.2书法字的预处理…………….29
第5章书法字识别算法应用……………39
5.1书法字识别算法在CADAL书法系统中的应用…………39
5.1.1应用背景………….39
5.1.2系统架构…………39
5.1.3系统展示………….41
5.2基于书法字识别结果的标注系统………42
第5章书法字识别算法应用
5.1书法字识别算法在CADAL书法系统中的应用
到目前为止,CADAL项目采用高精度扫描仪已数字化2744659册(件)数字资源,涵盖古籍、民国图书期刊和学位论文、现代中英文图书期刊和学位论文、科技报告、图形图像、书法作品、地方志等多种资源。如今基于这些数字的图书进行着三个项目的研宄,分别是中国书法,文学编年史和中医药。依托大量的数字信息进行应用项目的开发和推广,来服务广大用户。其中的中国书法资源的建设与利用是CADAL的一项重要组成部分,建有专门的中国书法系统网站,对外提供了书法作品的浏览与检索,书法字检索与合成、书法虚拟创作等服务供用户使用。
5.2基于书法字识别结果的标注系统
由于书法字复杂的形状和风格,对于普通大众来说难以识别。本文提出的书法字识别方法使用基于
您可能关注的文档
最近下载
- 广东长大美国科来福道路预防性养护和桥梁无缝伸缩缝系统工艺.pptx VIP
- 九年一贯制学校管理.pptx VIP
- 人力资源服务公司章程(申请人力资源许可证参考用).pdf VIP
- 四川大学生物医学工程基础课件.ppt
- 马克思的剩余价值理论课件(PPT 33页).ppt VIP
- SOC-OCV电池测试报告.docx VIP
- 纯化过滤专题报告之一:离子交换与吸附树脂行业报告,纯,现代工业生产中极致的魅力.pdf VIP
- 人类辅助生殖技术和人类精子库伦理原则.doc VIP
- 投标项目总体架构及技术解决方案.docx VIP
- 高二奋发+勇攀高峰+课件--2025-2026学年高二上学期开学第一课主题班会.pptx VIP
文档评论(0)