主题模型综述[实用].pptVIP

  • 1
  • 0
  • 约1.6千字
  • 约 15页
  • 2020-11-03 发布于福建
  • 举报
精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·收集整理 主题模型概述 THOMAS HOFMANN th@cs.brown.edu Department of Computer Science, Brown University, Providence, USA Unsupervised Learning by Probabilistic Latent Semantic Analysis * 精品PPT·借鉴参考 Content Latent semantic analysis(LSA) SVD Probabilistic latent semantic analysis(PLSA) Expect Maximum(EM) LDA(Latent Dirichlet Analysis) 各种变种及应用(扩展部分) * 精品PPT·借鉴参考 LSA 主要用于文本分析 思想:找低阶的矩阵对terms-doc矩阵进行分解,得到doc的潜在语义 可以处理多义词和同义词的问题 求解方式:SVD(奇异值分解) * 精品PPT·借鉴参考 SVD奇异值分解 词项文档矩阵做SVD分解 求解方法: 迭代法、并行方法、求NN’的特征值法 * 精品PPT·借鉴参考 PLSA Generate model 其中: P(di):表示生成这篇文章的先验概率 P(zk|di):表示在di这篇文章中选择主题zk的概率 P(wj|zk):表示在Zk主题下选择单词wj的概率 * 精品PPT·借鉴参考 * 精品PPT·借鉴参考 最大似然函数 * 精品PPT·借鉴参考 EM(期望最大化算法) EM算法的步骤是: (1)E步骤:求隐含变量Given当前估计的参数条件下的后验概率。 (2)M步骤:最大化Complete data对数似然函数的期望,此时我们使用E步骤里计算的隐含变量的后验概率,得到新的参数值。 两步迭代进行直到收敛。 * 精品PPT·借鉴参考 解决方法(MLE) * 精品PPT·借鉴参考 拉格朗日乘子法 * 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考 精品PPT·借鉴参考

文档评论(0)

1亿VIP精品文档

相关文档