2020北邮郭军web搜索chapter5.pptVIP

  • 8
  • 0
  • 约9.92千字
  • 约 60页
  • 2020-12-03 发布于天津
  • 举报
半监督学习的形式定义 1 { , , } l L x x 1 C i R ? ? y 1 { , , } l l u ? ? L x x 标注样本集合 L = 标注样本的类别向量 用 y ij = 1 and y iq = 0 (q ? j) 表示 x i 点属于第 j 类, C 为类别数 用 f i 表示, f i 是元素值为 0 或 1 的 C 维向量 用 Y 表示已标注样本集的真实类别矩阵 用 F 表示数据集的类别指示矩阵 ,其类别指示向量 设未标注样本集合 U = 半监督学习 : 在已知数据集 L 、 U 和 Y 的情况下估计 F 基于图的算法 ? 在图中估计样本的类别函数 f ,使其满足两个条件: ? 1) 对于已标注样本,其真实类别和通过 f 得到的结 果越接近越好 ? 2) 对于整个样本集, f 足够平滑 ? 这两个条件可以通过正则化方法得到满足,即在求解 的过程中用先验知识对求解过程加以约束,从而获得 有意义的解 ? 类别估计函数 f 一般由两项组成,一项是损失函数, 用来评价条件 1 的满足度;另一项是正则化,保证条 件 2 得到满足 基于随机场的半监督学习 ? 首先在图上定义一个连续的随机场,然后根据能 量函数最小化时调和函数的特性获得聚类结果 2 , 1 ( ) [ ( ) ( )] 2 ij i j E w i j ? ? ? f f f (

文档评论(0)

1亿VIP精品文档

相关文档