基于视觉字典容量自动获取的lda场景分类研究控制科学与工程专业论文.docxVIP

下载本文档

0
0
约5.25万字
约 142页
2019-01-24 发布于上海
举报
版权申诉

基于视觉字典容量自动获取的lda场景分类研究控制科学与工程专业论文.docx

1、本文档共142页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于视觉字典容量自动获取的lda场景分类研究控制科学与工程专业论文

优秀毕业论文精品参考文献资料分类号：分类号：学校代号： 11 845 UDC：密级：学号： 211 1204066 广东工业大学硕士学位论文 (工学硕士) 基于视觉字典容量自动获取的 LDA场景分类研究张艺指导教师姓名、职称：鲑哒壹副数拯学科(专业)或领域名称：控亟9型堂量至猩学生所属学院：自动丝堂医论文答辩日期：星Q!墨生鱼旦垒旦万方数据 A A Dissertation Submitted to Guangdong University of Technology for the Degree of Master (Master of Engineering Science) Research on Scene CIaSSifiCatiOn Of LDA Based on Visual Dictionary Capacity Automatic Obtaining Candidate：Yi Zhang Supervisor：Associate Prof．Yingchun Zhong May 201 5 SchooI of Automation Guangdong University of Technology Guangzhou，Guangdong，P．R．China，51 0006 万方数据摘要摘要摘要摘要随着计算机技术和互联网技术的迅速普及与应用，每天都会产生大量的数字图像。面对海量的图像数据集，如何使计算机按照人类认知的方式对这些图像数据集进行高效地分类已成为了图像理解研究领域的一个热点问题。场景图像分类的方法多种多样，其中，利用LDA(Latent Dirichlet Allocation，隐狄利克雷分配)模型实现场景图像分类是目前研究的一个热点。基于LDA模型的场景分类方法的经典流程是：首先提取所有场景图像的SIFT(Scale．invariant feature transform，尺度不变特征转换)特征，并利用K-means聚类算法对场景图像的SIFT特征进行聚类，构建视觉字典，然后计算场景图像SIFT特征与视觉字典中单词的欧氏距离，生成词频矩阵，最后利用LDA模型学习并完成场景分类。由于采用K-means聚类算法获取视觉字典容量时，需要人为反复试验才能确定合理的视觉字典容量，效率极其低下。针对这个问题，本文提出采用AP(Affinity Propagaion，吸引子传播)聚类算法自动获取合理的视觉字典容量，进而实现LDA模型场景分类，提高场景分类效率。本文的主要工作如下：首先，本文介绍了场景分类的背景以及研究意义；分析了场景分类的研究现状，并介绍了本文的研究工作和主要研究成果。其次，本文介绍了场景分类方法的相关理论。给出了场景分类的整体框架，阐述了场景图像SIFT特征提取的具体流程；列出了聚类算法的种类，详细介绍K-means 聚类算法和AP聚类算法，并分析比较了这两种聚类算法的优缺点。第三，提出了一种基于视觉字典容量自动获取的LDA场景分类方法。利用SIFT 算法提取场景图像的SIFT特征，然后分别使用K．means聚类算法和AP聚类算法获取视觉字典容量，构建视觉字典并生成图像SIFT特征与视觉字典中单词的词频矩阵，最后利用LDA模型学习潜在主题分布，实现场景分类。实验结果表明，本文提出的场景分类方法更高效。第四，本文对实验结果进行了分析。将基于K．means聚类算法的LDA场景分类方法与基于AP聚类算法的LDA场景分类方法的实验结果进行了对比。实验结果表明：基于AP聚类的LDA建模方法不仅能够较快的获取合理的视觉字典容量，而且场景分万方数据广东工业大学硕士学位论文类的准确率可达到广东工业大学硕士学位论文类的准确率可达到79％以上，而基于K-means聚类的LDA建模方法得到的分类准确率与视觉字典容量之间的关系曲线并无规律可循，分类准确率最高为78．10％。接着，研究LDA模型主题数对场景分类性能的影响，实验结果表明在主题数相对较少时具有相对较高的分类准确率；LDA模型中的两个超参数口和∥对分类效率没有影响，超参数口的改变对分类准确率的影响呈现无规律性，而超参数∥的增大，会导致分类准确率逐渐降低。最后，通过对图像场景分类结果的混淆矩阵的分析，结果表明：LDA模型对室内场景的分类准确率较低。最后，对本文的研究成果做出总结，指出本文主要的贡献，并给出了后续的研究建议。关键字：词包模型；视觉单词；视觉字典；隐狄利克雷分配模型万方数据 ABSTRACTABSTRACT ABSTRACT ABSTRACT It produces large amounts of digital images