- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
华 中科 技
华 中
科 技
大 学 硕
士 学
位 论 文
I
I
摘 要
随着移动互联网时代的到来,人们可以通过任何手持移动设备发布声音、图像 和视频等多媒体资源到互联网上,导致互联网上的多媒体信息呈爆炸式增长,基于 内容的图像分类和检索技术由于在管理和准确查询 web 图像等领域拥有广阔的应用 前景而受到业界越来越广泛的关注,例如 Google 和百度等搜索巨头都推出了自己的 图像检索功能。本文在分析目前 web 图像分类技术的基础上进行了深入的研究,结 合图像视觉特征和网页相关文本信息,设计并开发了一个 web 图像分类系统 Tiny Panda。
首先,为了全面的描述图像内容本身,本文提出一种基于 SVM 将 SURF 局部 特征描述子和全局特征决策融合的图像分类算法。该算法首先提取图像的 SURF 特 征向量集合,利用局部敏感哈希(Locality Sensitive Hashing , LSH)归约成单一直方 图向量,然后提取图像的全局特征(如颜色),接着分别利用 SVM 对上述特征进行 分类,并对其分类结果做决策融合,从而得到最终的分类结果。该算法除了综合利 用图像的局部特征和全局特征各自在图像特征描述方面的优势之外,既能克服全局 特征和局部特征直接融合用于图像分类时的维数泛滥,又能解决由于 SURF 关键点 数量造成的匹配点寻找时间复杂度过高的问题。
然后,在构建 web 图像分类系统的数据库时,设计并实现了基于关键字的 web 图像主题爬虫,在爬取图像的过程中,根据预先限定的一系列关键字来计算网页相 关度,并对网页正文区域进行识别,以达到网页级图像筛选以及网页中图像和文本 信息获取的目的,从而克服由于 Web 网页上图像纷繁复杂难以限定图像类别的问 题。
最后,采用融合图像和文本辅助的 web 图像分类技术,通过人工决策算法,融 合图像在视觉特征提取和 SVM 分类决策融合后获取的属于各类别的概率,以及网 页按照关键字相关度计算后获取的该图像所在网页对应文本类别的权重,实现 web 图像分类准确率的提高。
为了验证上述算法,本文设计并开发了一个 web 图像分类系统 Tiny Panda,系
II
II
统主要包括查询模块、视觉特征提取模块、多特征融合模块、web 图像主题爬虫模
块、视觉特征和文本信息融合模块等功能模块。通过对从网页上实时爬取的 13719 张 web 图像构建的图像库进行的实验,结果表明,决策融合 HSV 颜色和局部 SURF 特征后能将平均分类准确率从单一视觉特征的 74.6%提高到 82.7%;网页文本信息 辅助视觉特征的 web 图像分类能将平均分类准确率进一步提高到 91.5%。充分验证 了本文的多特征融合算法和文本辅助算法的有效性。
本文的研究工作是对基于内容的 web 图像分类和检索技术走向实用化和商业化 的有意探索和尝试,论文中提出的算法具有一定的理论意义及应用价值。
关键词:加速鲁棒特征;局部敏感哈希;支持向量机;决策融合;web 图像分类; 图像主题爬虫
PAGE III
PAGE III
Abstract
With the arrival of the mobile Internet era, people can upload multimedia resources such as voice, images and video to the Internet with the help of any hand-held mobile devices. It leads to multimedia information of the Internet growing explosively, and so content-based image classification and retrieval technology in the management and query web images has attracted more and more attention. This paper has carried on research of the web image classification techniques deeply, and a prototype web image classification system which was called Tiny Panda has been developed by combining the image visual features and related text information of web pages.
At first, in order to describe th
您可能关注的文档
- 基于随机模型泡沫材料力学性能研究-力学专业论文.docx
- 基于特征脸法的正面人脸识别研究-模式识别与智能系统专业论文.docx
- 基于特征脸法的正面人脸识别分析-模式识别与智能系统专业论文.docx
- 基于入侵检测理论的系统安全机制研究-计算机系统结构专业论文.docx
- 基于内聚力模型的单晶铝裂纹扩展的数值模拟-固体力学专业论文.docx
- 基于神经网络的自适应增益预测语音编码系统-信号与信息处理专业论文.docx
- 基于平衡计分卡的中型餐馆战略绩效评价体系研究-会计学专业论文.docx
- 基于阈值调整的半色调数字水印算法研究-计算机应用技术专业论文.docx
- 基于临界点理论的脉冲微分系统解的存在性问题研究-应用数学专业论文.docx
- 基于神经网络的矩形钢管混凝土柱承载性能研究-结构工程专业论文.docx
- 基于网络的大学生素质测评系统的设计与实现-计算机技术专业论文.docx
- 基于神经网络的atm带宽动态分配设计-计算机应用技术专业论文.docx
- 基于无源性的船舶直线航迹控制设计-控制理论与控制工程专业论文.docx
- 基于平衡计分卡的口岸汽车运输企业战略管理研究-工商管理专业论文.docx
- 基于神经网络的齿轮箱智能故障诊断的技术研究-机械设计及理论专业论文.docx
- 基于区间直觉模糊集的遥感图像滤波方法研究地图制图学与地理信息工程专业论文.docx
- 基于需求曲线的容量市场定价模型研究-电力系统及其自动化专业论文.docx
- 基于人工免疫的入侵检测系统模型研究-计算机软件与理论专业论文.docx
- 基于神经网络的质量诊断理论的研究与应用-机械电子工程专业论文.docx
- 基于遗传算法的异步电动机机械效率优化控制-控制理论与控制工程专业论文.docx
最近下载
- OIE规则和中国进展.ppt VIP
- 疾病预防控制体系建设中存在的问题及建议2025.pdf VIP
- AP微积分BC 2024年真题 附答案和评分标准 AP Calculus BC 2024 Real Exam with Answers and Scoring Guidelines.pdf VIP
- 一种环氧环己烷制备己二腈的方法.pdf VIP
- 标准图集-陕09J05 卫生间、盥洗室及洗池 09系列建筑图集.pdf VIP
- 2024年贵州省中考语文试卷(含答案与解析).pdf VIP
- 1湖南省电网销售电价表-附件1.doc
- 传动设备知识培训课件.pptx VIP
- 起重吊装模块设备设施风险分级管控清单.pdf VIP
- 《城镇给水管道非开挖修复更新工程技术规程 T244-2016》.doc VIP
文档评论(0)