- 11
- 0
- 约1.14万字
- 约 59页
- 2016-12-25 发布于重庆
- 举报
NMF 低秩分解 * * plsa是一种topic model,它属于生成模型,给定文档d后,以一定的概率选择d对应的主题z,然后以一定概率选择z中的词语w. PLSA的通俗理解: 想象某个人要写N篇文档,他需要确定每篇文档里每个位置上的词。假定他一共有K个可选的主题,有V个可选的词项,所以,他制作了K个V面的 “主题-词项” 骰子,每个骰子对应一个主题,骰子每一面对应要选择的词项。然后,每写一篇文档会再制作一颗K面的 ”文档-主题“ 骰子;每写一个词,先扔该骰子选择主题;得到主题的结果后,使用和主题结果对应的那颗”主题-词项“骰子,扔该骰子选择要写的词。他不停的重复如上两个扔骰子步骤,最终完成了这篇文档。重复该方法N次,则写完所有的文档。在这个过程中,我们并未关注词和词之间的出现顺序,所以pLSA也是一种词袋方法;并且我们使用两层概率分布对整个样本空间建模,所以pLSA也是一种混合模型。 * 与pLSA的不同?? * * * 信息检索模型是指如何对查询和文档进行表示,然后对它们进行相似度计算的框架和方法 本质上是对相关度建模 * 三类 基于内容的信息检索模型 结构化模型 浏览型数学模型 基于内容的信息检索模型有 集合论模型 布尔模型、模糊集合模型、扩展布尔模型 代数模型 向量空间模型、广义向量空间模型、潜在语义标引模型、神经网络模型 概率模型 经典概率
您可能关注的文档
- 高中英语建议信课件.ppt
- 高中英语必修1 Unit 15 课时巩固练习(含详细解析)(人教版).doc
- 1442因式分解公式法.ppt
- 16-不定积分及其计算.ppt
- 16《音乐之声(节选)》.ppt
- 19—斐波那契数列与黄金分割.ppt
- 1离散第5讲容斥原理与排列组合.ppt
- 高中英语必修五13单元单词讲解及词组.ppt
- 1统计学基本内容及统计图表.ppt
- 2012《课程标准》与初中英语课堂教学.ppt
- 建筑工程材料选择题:碳素结构钢与钢筋性能.pdf
- 眼部护理的跨文化比较.pptx
- 眼部护理:季节性变化的影响.pptx
- 眼部护理:男士与女士的特别需求.pptx
- 《快乐读书吧:在那奇妙的王国里》(课件)-2025-2026学年语文三年级上册统编版.pptx
- 眼部护理:眼部疲劳的预防措施.pptx
- 2026届九年级英语中考冲刺分层模拟卷与答案解析(质量检查版,含听力原文、作答空间和评分细则).docx
- 2026版项目投资合作协议书范本条款清单与签署风控提示模板(流程图).docx
- 2026版企业通用岗位结构化面试题库与综合评分表规范填写规范与审批台账模板(看板模板).docx
- 2026版企业会计准则现金流量表编制口径手册(执行版,含分类口径/填报模板填写规范与审批台账模板(测算模型).docx
最近下载
- 党的二十届四中全会公报知识测试题.docx VIP
- 2025年湖北省武汉市初三四月调考学业水平考试物化试卷.docx VIP
- 2025年6月浙江高考生物试卷真题及答案详解(精校打印版).pdf VIP
- 电商行业跨境贸易平台建设方案.doc VIP
- (2025)重症肺结核诊断和治疗专家共识培训课件.pptx VIP
- 雷雨第四幕剧本.doc VIP
- 2026年高考数学总复习选填题专项训练(六)附答案解析.pdf VIP
- 2022年上半年网络工程师下午真题.pdf VIP
- Q Q TC110—J03.0216-2016_机车、车辆轮对镟修作业.pdf VIP
- 三四年级上家长会完整省名师优质课赛课获奖课件市赛课一等奖课件.ppt VIP
原创力文档

文档评论(0)