多媒体搜索引擎firstcloudit.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多媒体搜索引擎firstcloudit

Multimedia Search Engine 多媒体搜索引擎 多媒体文档内容理解技术(3) 多媒体文档内容理解 数学模型表示的特征无法被人直接理解 用户的期望:用文字描述特征 ?把区域分类成具有语义的类别 如何分类? 分类算法 分类算法的基本框架 分类算法 例:水果包装流水线需将传送带上的水果按类放置在不同的包装箱 分类算法 例:水果包装流水线需将传送带上的水果按类放置在不同的包装箱 分类算法 g(x) = x1-T g(x)0: 苹果; g(x)=0:香蕉 分类模型 W=(1,T) 分类算法 例:水果包装流水线需将传送带上的水果按类放置在不同的包装箱 分类算法 例:水果包装流水线需将传送带上的水果按类放置在不同的包装箱 分类算法 例:水果包装流水线需将传送带上的水果按类放置在不同的包装箱 分类算法 分类模型 W=(w1, w2, w3) 分类算法 不可分问题(1) 广义线性判别函数 目前被认为效果最好的SVM也是基于此理论 分类算法 不可分问题(2) 分类算法 线性分类器 分类算法 线性分类器 获得权矢量W的方法 先验知识 例:苹果圆度接近1,香蕉圆度接近0 ?用T=0.7可作为合适的分类权重 ?难以普遍采用 如何改进? ?训练的方法 通过事先标注好的样本计算优化的W 分类算法 完整的分类算法 分类算法 分类算法的训练 几何方法 利用样本的分布求分类(超)平面 SVM /tutorials/svm.html 分类算法 概率分类器 分类算法 概率分类器 最简单情况:P(c1|X)和P(c2|X))是正态分布 P(ci|X)~N(?, ?) ?通过样本集计算?和?即可 复杂情况:样本分布不服从任何已知分布 混合高斯模型(GMM: Gaussian Mixture Model) 用多个正态分布的和拟合样本分布 分类算法 混合高斯模型 参数训练 设类ci的训练样本集为S: 分类算法 几何方法与概率方法的比较 几何方法 描述分类边界 最大化分类间隙 不可分样本需要特殊处理 需要较少训练样本 只描述边界?可能无法反映内部分布情况 概率方法 描述样本概率分布 最大化模型分布与样本分布的相似度 不可分样本无需特殊处理 需要较多训练样本 需要描述整个特征空间的分布?可能样本数量不够 Machine Learning * 区域和 特征 特征矢量 0 1 分类器 分类模型 0 1 圆度 X=(x,1)?g(x)=W XT 0 1 圆度 圆度 颜色 X=(x,1)?g(x)=W XT 变换到更高维的空间即可线性分离 无论变换到什么空间都不大可能实现线性分类 处理这个问题的方法是各种分类器的区别所在 特征矢量 0 1 分类模型 W g(x)=W XT g(x)=0 g(x)0 XT 如何获得W? 特征矢量 0 1 分类模型 (X1, c1) (X2, c2) (X3, c3) …… 训练样本 训练算法 如何获得训练样本? 唯一的办法是手工生成 如何训练? P(c1|X) P(c2|X) (P(c1|Xk)P(c2|Xk))? c1| c2 如何获得? 如何获得参数? 鸡生蛋?蛋生鸡?

文档评论(0)

136****3783 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档