- 22
- 0
- 约3.4千字
- 约 17页
- 2016-10-08 发布于重庆
- 举报
基于贝叶斯模型的多标签分类算法研究结论
Company Logo LOGO 基于贝叶斯模型的多标签分类算法研究 张洛阳、毛嘉莉、刘斌、吴涛 西华师范大学 大纲 引言 国内外研究现状 BR和CC算法分析 基于贝叶斯模型的多标签分类算法 算法仿真实验及结果分析 结论 基于贝叶斯模型的多标签分类算法研究 基于贝叶斯模型的多标签分类算法研究 多标签分类 允许实例拥有多个类别(或称为标签) 多标签分类的应用场景 例如,在互联网营销中,通过搜索、浏览、点击、购买等行为为每一个用户建立多个特征标签,有利于电商进行合理的个性化推荐。 大纲 引言 国内外研究现状 BR和CC算法分析 基于贝叶斯模型的多标签分类算法 算法仿真实验及结果分析 总结 基于贝叶斯模型的多标签分类算法研究 基于贝叶斯模型的多标签分类算法研究 问题转换 二元关联(Binary Relevance, BR):忽略标签之间相互关系 标签幂集法(Label Power-set, LP):偏置性 剪枝幂集(Pruned Problem Transformation, PPT) 随机标签(Random k-label-sets, RAkEL) 算法转换 多标签k近邻法(Multi-label KNN, MLKNN) 多标签后向传播网络(Back-Propagation MLL, BPMLL) 排序支持向量机(Rank Support Vector Machine, R-SVM) 随机游走模型(Multi-label Random Walk, MLRW) 算法模型 链型分类(Classifier Chain, CC):性能受特征属性维数约束 组合链型分类(Ensembles of Classifier Chains, ECC) 概率链型分类(Probabilistic Classifier Chain, PCC) 贝叶斯链型分类(Bayesian Chain Classifier, BCC) 大纲 引言 国内外研究现状 BR和CC算法的不足 基于贝叶斯模型的多标签分类算法 算法仿真实验及结果分析 总结 基于贝叶斯模型的多标签分类算法研究 基于贝叶斯模型的多标签分类算法研究 多标签分类的数学描述:根据实例的属性(特征属性或标签属性),在2|L|种标签组合中选取概率最大的作为该实例的标签。 (1) BR算法由|L|个二类分类器组成,并且假设标签相互独立 (2) 显然式(1)和式(2)在绝大多数情况下不相等。 基于贝叶斯模型的多标签分类算法研究 CC算法把已分类标签当作未分类标签的特征属性,分类器训练阶段会考虑标签之间相关性,因此有下式成立: (3) 当实例的特征属性维数过大时,新增的特征属性不能影响分类器的输出结果,因此该算法的性能没有得到提升。 (4) 针对BR和CC的不足,提出贝叶斯模型多标签分类算法。标签的取值由属性置信度和标签置信度共同决定。 大纲 引言 国内外研究现状 BR和CC算法的不足 基于贝叶斯模型的多标签分类算法 算法仿真实验及结果分析 总结 基于贝叶斯模型的多标签分类算法研究 基于贝叶斯模型的多标签分类算法研究 属性置信度:由分类器根据实例的特征属性计算得到,记作confa(l)?,并且满足 : (5) K近邻(K Nearest Neighbor)输出的结果满足(5)式,可以直接作为属性置信度。 标签置信度:指在已知前i-1个标签取值的前提下第i个标签取值的先验概率(KNN仅考虑K个最近邻),记作confb(l)。 (6) Rank(L)={rank[1],…,rank[n]}表示实例的标签根据分类器输出的confa(l)进行降序排列的序列,其中
原创力文档

文档评论(0)