- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
., ., ., ., ., 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 主题模型概述 THOMAS HOFMANN th@cs.brown.edu Department of Computer Science, Brown University, Providence, USA Unsupervised Learning by Probabilistic LatentSemantic Analysis ., * Content Latent semantic analysis(LSA) SVD Probabilistic latent semantic analysis(PLSA) Expect Maximum(EM) LDA(Latent Dirichlet Analysis) 各种变种及应用(扩展部分) ., * LSA 主要用于文本分析 思想:找低阶的矩阵对terms-doc矩阵进行分解,得到doc的潜在语义 可以处理多义词和同义词的问题 求解方式:SVD(奇异值分解) ., * SVD奇异值分解 词项文档矩阵做SVD分解 求解方法: 迭代法、并行方法、求NN’的特征值法 ., * PLSA Generate model 其中: P(di):表示生成这篇文章的先验概率 P(zk|di):表示在di这篇文章中选择主题zk的概率 P(wj|zk):表示在Zk主题下选择单词wj的概率 ., * ., * 最大似然函数 ., * EM(期望最大化算法) EM算法的步骤是: (1)E步骤:求隐含变量Given当前估计的参数条件下的后验概率。 (2)M步骤:最大化Complete data对数似然函数的期望,此时我们使用E步骤里计算的隐含变量的后验概率,得到新的参数值。 两步迭代进行直到收敛。 ., * 解决方法(MLE) ., * 拉格朗日乘子法 ., * ., ., ., ., ., 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件 精选 课件
您可能关注的文档
- [新版]《“中国速度”震惊雅典》课件1.ppt
- 完整版“珍爱生命感恩生活”主题班会.ppt
- “珍爱生命,我的责任”主题班会精梳版.ppt
- 资料“在”与“再”的正确用法1.ppt
- 学习版“图形与几何”的内容标准.ppt
- 合集“守望”话题作文指导.ppt
- (整理)“生命教育”主题班会第2版.ppt
- 演示课件“举止文明”主题班会.ppt
- “讲卫生我健康”主题班会_PPT完整版.ppt
- 全版“东”、“西”的文化含义.ppt
- 山东省临沂市沂水县2023-2024学年高一下学期期中考试历史试题.docx
- 江苏省泰州市靖江高级中学2023-2024学年高二下学期4月期中考试物理试题(无答案).docx
- 新疆部分名校2023-2024学年高二下学期期中联合考试语文试题.docx
- 湖南省岳阳市岳阳县第一中学2023-2024学年高三下学期4月期中考试数学试题.docx
- 山东省烟台市2023-2024学年高二下学期4月期中生物试题(无答案).docx
- 江苏省靖江高级中学2023-2024学年高二下学期期中地理试题(无答案).docx
- 四川省甘孜藏族自治州某重点中学2023-2024学年高一下学期4月期中考试物理试题.docx
- 湖北省武汉市华中师范大学第一附属中学2023-2024学年高二下学期4月期中英语试题(无答案).docx
- 四川省成都市金牛区成都市实验外国语学校2024年高三三模考试生物试题.docx
- 浙江省宁波市北仑中学2023-2024学年高二下学期期中考试物理试题.docx
文档评论(0)