* * * 可去掉 * * * * * * * * * * * * * * * * 将信息检索作为分类问题(Cont.) P(R|D):当文档D是相关文档的条件概率; P(NR|D):当文档D是非相关文档的条件概率。 检索问题即求条件概率问题 If Prob(R|di, q) Prob(NR|di, q) then di 是检索结果,否则不是检索结果 * 概率检索模型背景知识 概率检索模型将文档向量与查询向量间的相关度概率化,在概率论的框架下解决信息检索的问题。例如:定义三个随机变量R,Q,D:相关度R={0,1},查询Q={q1,q2,…},文档D={d1,d2,…},则可以通过计算条件概率P(R=1|Q=q,D=d)来度量文档和查询的相关度。 概率模型包括一系列模型,如l回归模型及最经典的二值独立模型BIM、BM25模型等。 7.2 概率模型(Cont.) * 基本假设 文档对查询的相关性与文档集合中的其它文档无关,这点被称为概率模型的相关性独立原则; 文档和查询中的特征项与特征项之间是相互独立的; 文档和查询中的特征项权重都是二值的,即要么是0,要么是1; 文档相关性是二值的,即只有相关和不相关两种,也就是说,一篇文档要么属于理想文档集,要么不属于理想文档集。 7.2 概率模型(Cont.) 查询式与文档的相关度概率定义 在概率模型中特征项的权重都是二值的 wi,j
您可能关注的文档
- 最新DCS系统硬件学习.ppt
- 最新DCS选用和应用.ppt
- 最新DCS子系统功能介绍.ppt
- 最新DCT及JPEG编码.doc
- 最新DCT双离合器毕业设计.doc
- 最新DCYX合富比华利山营销策划方案5.ppt
- 最新DCYX新景祥万家居岳阳县项目报告.ppt
- 最新DC维修手册.doc
- 最新DDD在ICU如何把握?.ppt
- 最新DDFI防雷支柱绝缘子.doc
- 2026年智慧健康管理系统创新报告.docx
- 河北衡水市武强中学2025-2026学年高二下学期4月期中物理试题(含解析).docx
- 2026年人工智能行业智能老年防走失定位器创新报告.docx
- 2026年低空经济飞行器量子技术应用创新报告.docx
- 2026年农业智能农业智能育种创新报告.docx
- 河北省保定市莲池区保定市第一中学2025-2026学年高二下学期期中考试生物试题(含解析).docx
- 2026年智慧城市电子站牌充电创新报告.docx
- 河北省邯郸市平恩中学等校2025-2026学年八年级期中考试英语试题(含解析).docx
- 2026年供应链创新技术应用报告.docx
- 2026年体育智能赛事管理系统支付系统创新报告.docx
最近下载
- 《山东省房屋修缮工程消耗量定额》建筑分册交底培训资料.pdf VIP
- 2026年二级建造师《机电》关键词速记.pdf
- 威海市环翠区2025-2026学年第二学期三年级语文期末考试卷(部编版含答案).docx VIP
- 2024年江西省中考地理真题卷含答案解析.pdf VIP
- 锅炉压力容器压力管道焊工证项目代号含义-精品完整版.doc VIP
- 合金结构钢GB3077—1999(完整).pdf VIP
- 电梯维护保养作业指导书与检查记录.docx VIP
- 2026春青岛版三年级数学下册智慧广场逆推教学设计与评析.docx VIP
- Vic-3D 非接触全场应变测量系统.pdf VIP
- 2023年江苏省南通市小升初英语试卷(含笔试部分答案).pdf VIP
原创力文档

文档评论(0)