网站大量收购独家精品文档,联系QQ:2885784924

基于视觉字典容量自动获取的lda场景分类研究控制科学与工程专业论文.docxVIP

基于视觉字典容量自动获取的lda场景分类研究控制科学与工程专业论文.docx

  1. 1、本文档共142页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于视觉字典容量自动获取的lda场景分类研究控制科学与工程专业论文

优秀毕业论文 精品参考文献资料 分类号: 分类号: 学校代号: 11 845 UDC: 密级: 学 号: 211 1204066 广东工业大学硕士学位论文 (工学硕士) 基于视觉字典容量自动获取的 LDA场景分类研究 张艺 指导教师姓名、职称: 鲑哒壹副数拯 学科(专业)或领域名称: 控亟9型堂量至猩 学生所属学院: 自动丝堂医 论文答辩日期: 星Q!墨生鱼旦垒旦 万方数据 A A Dissertation Submitted to Guangdong University of Technology for the Degree of Master (Master of Engineering Science) Research on Scene CIaSSifiCatiOn Of LDA Based on Visual Dictionary Capacity Automatic Obtaining Candidate:Yi Zhang Supervisor:Associate Prof.Yingchun Zhong May 201 5 SchooI of Automation Guangdong University of Technology Guangzhou,Guangdong,P.R.China,51 0006 万方数据 摘要摘要 摘要 摘要 随着计算机技术和互联网技术的迅速普及与应用,每天都会产生大量的数字图像。 面对海量的图像数据集,如何使计算机按照人类认知的方式对这些图像数据集进行高 效地分类已成为了图像理解研究领域的一个热点问题。 场景图像分类的方法多种多样,其中,利用LDA(Latent Dirichlet Allocation,隐狄 利克雷分配)模型实现场景图像分类是目前研究的一个热点。基于LDA模型的场景分 类方法的经典流程是:首先提取所有场景图像的SIFT(Scale.invariant feature transform, 尺度不变特征转换)特征,并利用K-means聚类算法对场景图像的SIFT特征进行聚类, 构建视觉字典,然后计算场景图像SIFT特征与视觉字典中单词的欧氏距离,生成词频 矩阵,最后利用LDA模型学习并完成场景分类。由于采用K-means聚类算法获取视觉 字典容量时,需要人为反复试验才能确定合理的视觉字典容量,效率极其低下。针对 这个问题,本文提出采用AP(Affinity Propagaion,吸引子传播)聚类算法自动获取合理 的视觉字典容量,进而实现LDA模型场景分类,提高场景分类效率。本文的主要工作 如下: 首先,本文介绍了场景分类的背景以及研究意义;分析了场景分类的研究现状, 并介绍了本文的研究工作和主要研究成果。 其次,本文介绍了场景分类方法的相关理论。给出了场景分类的整体框架,阐述 了场景图像SIFT特征提取的具体流程;列出了聚类算法的种类,详细介绍K-means 聚类算法和AP聚类算法,并分析比较了这两种聚类算法的优缺点。 第三,提出了一种基于视觉字典容量自动获取的LDA场景分类方法。利用SIFT 算法提取场景图像的SIFT特征,然后分别使用K.means聚类算法和AP聚类算法获取 视觉字典容量,构建视觉字典并生成图像SIFT特征与视觉字典中单词的词频矩阵,最 后利用LDA模型学习潜在主题分布,实现场景分类。实验结果表明,本文提出的场景 分类方法更高效。 第四,本文对实验结果进行了分析。将基于K.means聚类算法的LDA场景分类方 法与基于AP聚类算法的LDA场景分类方法的实验结果进行了对比。实验结果表明: 基于AP聚类的LDA建模方法不仅能够较快的获取合理的视觉字典容量,而且场景分 万方数据 广东工业大学硕士学位论文类的准确率可达到 广东工业大学硕士学位论文 类的准确率可达到79%以上,而基于K-means聚类的LDA建模方法得到的分类准确率 与视觉字典容量之间的关系曲线并无规律可循,分类准确率最高为78.10%。接着,研 究LDA模型主题数对场景分类性能的影响,实验结果表明在主题数相对较少时具有相 对较高的分类准确率;LDA模型中的两个超参数口和∥对分类效率没有影响,超参数 口的改变对分类准确率的影响呈现无规律性,而超参数∥的增大,会导致分类准确率 逐渐降低。最后,通过对图像场景分类结果的混淆矩阵的分析,结果表明:LDA模型 对室内场景的分类准确率较低。 最后,对本文的研究成果做出总结,指出本文主要的贡献,并给出了后续的研究 建议。 关键字:词包模型;视觉单词;视觉字典;隐狄利克雷分配模型 万方数据 ABSTRACTABSTRACT ABSTRACT ABSTRACT It produces large amounts of digital images

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档