- 1、本文档共142页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于视觉字典容量自动获取的lda场景分类研究控制科学与工程专业论文
优秀毕业论文
精品参考文献资料
分类号:
分类号: 学校代号: 11 845
UDC: 密级: 学 号: 211 1204066
广东工业大学硕士学位论文
(工学硕士)
基于视觉字典容量自动获取的 LDA场景分类研究
张艺
指导教师姓名、职称: 鲑哒壹副数拯 学科(专业)或领域名称: 控亟9型堂量至猩 学生所属学院: 自动丝堂医 论文答辩日期: 星Q!墨生鱼旦垒旦
万方数据
A
A Dissertation Submitted to Guangdong University of Technology for the Degree of Master
(Master of Engineering Science)
Research on Scene CIaSSifiCatiOn Of LDA Based on Visual Dictionary Capacity
Automatic Obtaining
Candidate:Yi Zhang Supervisor:Associate Prof.Yingchun Zhong
May 201 5
SchooI of Automation Guangdong University of Technology
Guangzhou,Guangdong,P.R.China,51 0006
万方数据
摘要摘要
摘要
摘要
随着计算机技术和互联网技术的迅速普及与应用,每天都会产生大量的数字图像。 面对海量的图像数据集,如何使计算机按照人类认知的方式对这些图像数据集进行高 效地分类已成为了图像理解研究领域的一个热点问题。
场景图像分类的方法多种多样,其中,利用LDA(Latent Dirichlet Allocation,隐狄 利克雷分配)模型实现场景图像分类是目前研究的一个热点。基于LDA模型的场景分
类方法的经典流程是:首先提取所有场景图像的SIFT(Scale.invariant feature transform, 尺度不变特征转换)特征,并利用K-means聚类算法对场景图像的SIFT特征进行聚类, 构建视觉字典,然后计算场景图像SIFT特征与视觉字典中单词的欧氏距离,生成词频 矩阵,最后利用LDA模型学习并完成场景分类。由于采用K-means聚类算法获取视觉 字典容量时,需要人为反复试验才能确定合理的视觉字典容量,效率极其低下。针对
这个问题,本文提出采用AP(Affinity Propagaion,吸引子传播)聚类算法自动获取合理 的视觉字典容量,进而实现LDA模型场景分类,提高场景分类效率。本文的主要工作 如下:
首先,本文介绍了场景分类的背景以及研究意义;分析了场景分类的研究现状,
并介绍了本文的研究工作和主要研究成果。
其次,本文介绍了场景分类方法的相关理论。给出了场景分类的整体框架,阐述 了场景图像SIFT特征提取的具体流程;列出了聚类算法的种类,详细介绍K-means 聚类算法和AP聚类算法,并分析比较了这两种聚类算法的优缺点。
第三,提出了一种基于视觉字典容量自动获取的LDA场景分类方法。利用SIFT 算法提取场景图像的SIFT特征,然后分别使用K.means聚类算法和AP聚类算法获取 视觉字典容量,构建视觉字典并生成图像SIFT特征与视觉字典中单词的词频矩阵,最 后利用LDA模型学习潜在主题分布,实现场景分类。实验结果表明,本文提出的场景 分类方法更高效。
第四,本文对实验结果进行了分析。将基于K.means聚类算法的LDA场景分类方 法与基于AP聚类算法的LDA场景分类方法的实验结果进行了对比。实验结果表明: 基于AP聚类的LDA建模方法不仅能够较快的获取合理的视觉字典容量,而且场景分
万方数据
广东工业大学硕士学位论文类的准确率可达到
广东工业大学硕士学位论文
类的准确率可达到79%以上,而基于K-means聚类的LDA建模方法得到的分类准确率 与视觉字典容量之间的关系曲线并无规律可循,分类准确率最高为78.10%。接着,研 究LDA模型主题数对场景分类性能的影响,实验结果表明在主题数相对较少时具有相
对较高的分类准确率;LDA模型中的两个超参数口和∥对分类效率没有影响,超参数 口的改变对分类准确率的影响呈现无规律性,而超参数∥的增大,会导致分类准确率 逐渐降低。最后,通过对图像场景分类结果的混淆矩阵的分析,结果表明:LDA模型
对室内场景的分类准确率较低。
最后,对本文的研究成果做出总结,指出本文主要的贡献,并给出了后续的研究
建议。 关键字:词包模型;视觉单词;视觉字典;隐狄利克雷分配模型
万方数据
ABSTRACTABSTRACT
ABSTRACT
ABSTRACT
It produces large amounts of digital images
您可能关注的文档
- 滚动轴承振动信号降噪方法研究控制工程专业论文.docx
- 风电功率概率特征建模及风险分析应用电气工程专业论文.docx
- 伐根清理机器人设计理论与应用技术的研究森林工程专业论文.docx
- 东北特钢新旧项目并行人力资源管理案例研究项目管理专业论文.docx
- 不同位点组合心脏再同步起搏治疗慢性缺血性心力衰竭的实验分析内科学专业论文.docx
- 敦煌曲子词用韵研究汉语言文字学专业论文.docx
- 滨州市文化产业发展研究公共管理专业论文.docx
- 定向井pdc钻头钻进趋势研究油气井工程专业论文.docx
- 公众参与公用事业民营化问题研究行政管理专业论文.docx
- 大跨刚构连续组合梁桥抖振时域分析桥梁与隧道工程专业论文.docx
文档评论(0)