大规模主题模型建模及其在腾业务中的应用.pdf

大规模主题模型建模及其在腾业务中的应用.pdf

大规模主题模型建模及其在腾业务中的应用

Peacock: ⼤规模主题模型 及其在腾讯业务中的应⽤ Rickjin(靳志辉) 腾讯SNG效果⼲告平台部 Outline • Peacock Demo • 主题模型背景介绍 • ⼤规模主题模型学习系统 Peacock • Peacock 在腾讯业务中的应⽤ • 红酒⽊⽠汤 • 苹果 • 莫代尔 3 Peacock Demo 4 5 6 7 8 Peacock Team Peacock: Learning Long-Tail Topic Features for Industrial Applications ACM Transactions on Intelligent Systems and Technology, 2014 Yi Wang Xuemin Zhao Zhenlong Sun Hao Yan Lifeng Wang Zhihui Jin Liubin Wang 9 Doc-Topic Structure • Doc 是由 topic 组成的 • Topic 是 Vocab 上的概率分布 [Hofmann, 1999] PLSA Topic Modeling Docs Topics Words P(topic|doc) P(word|topic) LDA Topic Modeling Docs Topics Words P(topic|doc) P(word|topic) LDA Model Training N N Step1: 随机初始化每个词的 topic t,d w,t Doc_1 w w … w z z z z …… Doc_n w w … w z z z z LDA Model Training N N Step2: 重新采样每个 topic, 更新计数 t,d w,t Doc_1 w w … w z z z z …… Doc_n w w … w z z z z P(topic|doc) P(word|topic

文档评论(0)

1亿VIP精品文档

相关文档