- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于字符匹配度SVM多分类器设计
基于字符匹配度SVM多分类器设计
【 摘 要 】 本文介绍了常用的SVM多分类器的构造思路,并且分析比较了各种思路的优缺点。针对二叉树决策法中强制分类存在的误判情况,提出了基于字符匹配度的SVM多分类器设计方案。通过实验对比各种多分类器的分类器数量、平均分类次数、训练和判断时间、识别正确率,证明了该构造方案的优越性。
【 关键词 】 SVM多分类器;字符识别;二叉树决策
【 中图分类号 】 TP391.04 【 文献标识码 】 A
A Design for SVM Multi-classifier Based on Character Match
Zhang Gong
(School of Instrument Science and Opto-Electronic Engineering, Beihang University Beijing 100191)
【 Abstract 】 This article describes the common methods of SVM classifiers and it analyzes and compares the advantages and disadvantages of various methods. For reducing the false classification of binary tree decision method, it designs SVM multi-classifier based on Character-matching. By experiment,the comparisons of classification number, the number of average classification, training and judgment time, recognition accuracy prove the superiority of the structure plan.
【 Keywords 】 svm multi-classifier;ocr;binary tree decision
1 引言
字符识别(OCR,Optical Character Recognition)的核心在于特征的提取与识别。支持向量机(SVM,Support Vector Machine)作为一种机器学习的二分类器,以其识别速度快、识别率高、计算量小等优点,广泛应用于字符识别和其他模式识别领域。实际应用中,待识别的字符样本往往不仅两类。因此如何利用SVM设计多分类器,并使其保持SVM良好的分类特性,已成为了一个被广泛研究的课题。
2 SVM多分类器原理及分类
SVM的基本原理是将样本向量映射到多维空间中,通过求解最优超平面将样本划分为两类。距离最优超平面距离最近的样本称为支持向量,最优超平面要确保距离支持向量的距离最远。
利用SVM解决多分类问题,一种思路是直接进行多类分类,另一种方法是将多类分类转化为多个二分类问题。
2.1 直接构造多分类器
基本思路是将多分类问题转化为统一的凸规划问题,最优化问题求解过程中引入投票机制。
这种方法优点是只需要1个分类器,缺???是算法过于复杂,实际应用效果一般。
2.2 间接构造多分类器
多分类器转化为多个二分类器的方法较多,基本的思路有三种。
2.2.1 one against one
每次从K类中任取两类划分,共需K(K-1)/2个分类器,同时引入投票机制。
该方法优点是训练样本集只需2/K个,算法简单,缺点是需要K(K-1)/2个分类器,效果一般。
2.2.2 one against all
K个二分类器依次判断样本是否属于对应的类,决策函数认定样本属于指标函数最大的类。
该方法优点是可充分利用全体样本,不存在盲区,缺点在于计算量大,效果一般。
2.2.3二叉树决策法
将所有样本分为两个子类,每个子类再分为两部分,依次循环,当所有子类为单一分类时结束。
该方法的优点是理论上需要K-1个分类器,训练样本在逐步减小,同时有效地避免了投票机制,实际中应用效果较好。
该方法的缺点在于同一决策树不适用不同样本,同一样本可对应多种决策树。算法的好坏主要依赖所选样本和所选决策树。
3 基于字符匹配度的SVM多分类器
本文针对样本(0…9,A…Z)设计多分类器,评价标准第一是识别的正确率,第二是识别速度(取决于分类器的数量和算法复杂程度)。
3.1 设计思路
分类过程先粗分,再细分。相似字符在粗分类过程中可归为
您可能关注的文档
最近下载
- 四年级语文下册《铁杵成针》导学案教案教学设计集体备课.doc VIP
- 幼儿通识性知识大赛考试总题库-上(单选题部分).docx VIP
- 3 桂花雨 教案 2025-2026学年五年级语文上册 统编版.docx VIP
- 梅毒血清学检测的操作规范课件.ppt VIP
- 《无损检测》射线检测课件.pptx VIP
- 4 珍珠鸟 教案 2025-2026学年五年级语文上册 统编版.docx VIP
- 《桂枝香·金陵怀古》ppt课件(21页).ppt VIP
- 2025至2030中国衣架行业市场深度研究与战略咨询分析报告.docx
- 2025年重庆一中中考数学三模试卷(含答案).pdf VIP
- 2021年重庆一中中考数学诊断试卷.pdf VIP
文档评论(0)