下载资源:智能技术与自然语言处理研究室.ppt

下载资源:智能技术与自然语言处理研究室.ppt

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
下载资源:智能技术与自然语言处理研究室

图像分类算法与应用研究 报告人: 张德园 导 师:王晓龙教授 目录 研究背景 相关研究工作 已有工作基础 论文主要研究内容 课题来源 本课题来源于国家八六三计划目标导向类课题“基于NLP的智能搜索引擎”(项目编号:2006AA01Z197)。 实际意义 按照语义内容进行图像管理/图像浏览 减少人工标注时间(Flickr, Picasa) 辅助图像检索(Google, Baidu, Picsearch) 图像分类的语义层次 场景分类 物体分类 图像分类 图像分类的挑战 图像分类的挑战 研究现状 图像表示 底层视觉特征表示 语义图像表示 词包模型表示 机器学习算法 多示例学习算法 底层视觉特征表示 Vailaya 6类假日图片 层次分类 贝叶斯分类器 Chang 全局特征,SVM分类器 付岩 3类图片 3种颜色特征对比 SVM分类器 Torralba 收集了8000万张32*32的图片,用最近邻方法进行分类 语义图像表示(全局) 语义图像表示(局部) 词包模型 Dense Harris-Laplace Hessian-Laplace Harris Hessian Edge-Laplace Haar-Hessian DoG( Difference of Gaussian) Patch SIFT gradient location and orientation histogram (GLOH) shape context steerable filters moment invariants SURF State of Art方法 词汇表的构造(K-Means,GMM,VQ,pLSA) 图像相似性的度量(Distance Metric Learning, Kernel Methods(PMK,EMD) ) 多特征融合(Random Forest/Ferns,SVM) 图像空间信息的利用(Spatial Pyramid, ABS-pLSA,TSI-pLSA,LDA(Fei-Fei) ) 感兴趣区域选取(Anna Bosch) 多示例学习 多示例训练集由包(bag)组成,每个包里面包含多个实例(instance)。如果一个包为正例,则包中至少有一个实例为正例;如果一个包为反例,则包中所有的实例均为反例。 方法: Maron─Diverse Density Andrew ─ Mi-SVM以及MI-SVM Chen ─ DD-SVM以及MILES Qi ─DD-SVM变种 周志华─MIML框架(Multi-Instance Multi-Label) 已有工作基础 支持向量机(SVM)进行图像分类 融合多分类器的图像分类 SVM进行图像分类 常用核函数 Evaluation 多分类器融合的图像分类 模糊积分 模糊积分 训练 传统的Reward-Punishment算法 设置初始gi 对训练样本的分类进行Reward和Punishment 对初始gi依赖,陷入局部最优解 改进 设置多组初始gi 本文选取gi=t/N 结果 结果比较 主要研究内容,实施方案与可行性论证 组合多分类器框架的研究 最优词汇表构造的研究 最优空间信息进行图像分类的研究 Internet图像挖掘研究 组合多分类器框架的研究 组合分类器框架选择 分类器权重计算 分类器选择 最优词汇表构造的研究 Filter方法 预计方法: 生成一个较大的词汇表(5000-10000) 根据每个词汇的对类别的判别能力控制聚类 最优空间信息进行图像分类的研究 Kernel Methods Gaussian, χ2 ,Histogram Intersection 根据训练图像学习出金字塔每个层次的最优权重 Internet图像挖掘研究 现有图像挖掘方法的不足: 训练数据存在噪声 不能很好的突破搜索引擎返回结果数量的限制 解决方案: 查询扩展 多个搜索引擎结果集成 文本分类技术与图像分类技术结合 少量标记样本半监督学习 论文进度安排 2006年9月-2007年7月:阅读相关文献,分析图像分类在国内外的研究现状 2007年9月-2008年6月:进行组合多分类器方面的研究,发表一篇以上学术论文 2008年8月-2008年12月: 进行最优空间信息进行图像分类的研究,发表一篇以上学术论文 2009年1月-2009年5月:进行最优词汇表构造的研究,发表一篇以上学术论文 2009年6月-2009年12月:进行网络分类挖掘的研究,发表一篇学术论文 2010年1月-2010年4月:总结博士阶段所做的工作,撰写博士论文 2010年5月-2010年7月:准备答辩 预期达到目标 建立通用的图像分类系统,达到如下指标:Caltech101 80% Caltech256 45% Corel十类9

文档评论(0)

docman126 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档