- 1、本文档共58页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
Q是一个查询集合,是用户任务的表达,由查询需求的逻辑视图来表示。R(qi,dj)是一个排序函数,它给查询qi和文档dj之间的相关度赋予一个排序值即:IR模型由上述三个要素组成R(qi,dj)=F(D,Q)检索模型的基本概念——模型要素1、布尔模型一种简单的检索模型,它建立在经典的集合论和布尔代数的基础上基本原理系统索引词集合中的每一个索引词在一篇文档中只有两个状态01出现01不出现检索提问式q由三种布尔运算符“and”、“or”、“not”连接索引词来构成011、布尔模型01具有某种属性的事物的全体就构成一个集合,以A,B,C,…表示构成集合的事物,以a,b,c,…表示该集合的元02某个图书馆现存的所有图书——有限集03以S1={a,b,c,d}表示集合的几种表示布尔模型A所有的正整数——无限集B以S2={1,2,3,4,…}表示CP(x)表示与元x有关的一个属性DS3={x|x是正偶数}ES4={x|1x10}为空集集合的几种表示布尔模型布尔模型——集合的表示集合间的关系x是A中的一个元,记作x∈Ax不是A中的一个元,记作x?A集合的图形表示空间E集合A元x布尔模型——集合的运算并运算设A,B是两个集合,集合A与B的并运算是由A的一切元素和B的一切元素所组成的集合,记做A∪B,数学表示为:设A={a,b,c,d,e},B={c,d,x,y,z}则A∪B={a,b,c,d,e,x,y,z}即A∪B={x|x∈A∨x∈B}AB空间E交运算布尔模型——集合的运算设A,B是两个集合,包含A和B的所有公共元素的集合叫做A与B的交集,记做A∩B,数学表示为:01则A∩B={c,d}03设A={a,b,c,d,e},B={c,d,x,y,z}02即A∩B={x|x∈A∧x∈B}04每个索引词在一篇文档中只有两种状态:出现或不出现,对应逻辑值为0或1查询是由三种布尔逻辑运算符and,or,not连接索引词组成的布尔表达式遵循两条基本规则布尔模型差运算布尔模型——集合的运算设A,B是两个集合,A-B是由一切属于A但不属于B的元素所组成的集合,称为B在A中的余集,或者A与B的差,即设A={a,b,c,d,e},B={c,d,x,y,z}则A-B={a,b,e},B-A={x,y,z}数学表示为A-B={x|x∈A﹁x∈B}布尔模型定义用qdnf表示查询q的析取范式,qcc表示qdnf的任意合取分项,文献dj与查询q的相似度为如果,则表示文献dj与q相关,否则为不相关。sim(dj,q)为该模型的匹配函数(相似度)布尔模型——优缺点优点简单而整齐自我保护功能,降低用户对搜索系统的期望,使自己不在责任方,检索结果不好的原因在于用户构造查询不好简单、易理解、简洁的形式化缺点它的检索策略是基于二值决策准则,即一个文档只被判断成相关的或不相关的,无任何等级变化当用布尔表达式表示精确语义的时候,很难将信息表达为一个布尔表达式准确匹配,信息需求的能力表达不足布尔模型目前仍然是商业文档数据库的主流模型,并为一些新的领域提供了一个好的起点2、向量模型——n维向量考虑从空间坐标系原点出发(其他向量可以平移到原点出发)的向量,其终点坐标为x1,x2,…,xn,我们称之为一个n维向量2、向量模型——n维向量向量的运算加、减、倍数、内积如果把每个标引词看作是一个向量,代表了空间的一个维,则由这些标引词集合定义了一个空间01文献集合中的任一文献都可以表示为这个多维空间中的一个向量,这个空间就成为“文献空间”02文献空间向量模型——空间概念文献集合中的一篇文献可看成是标引词空间的一个维,空间中的一点代表一个标引词点01从原点到该点的向量就是一个标引词向量02它在各个轴上的分量就是该标引词在各个轴所代表的相应文献中的权重03标引词空间向量模型——空间概念布尔模型基于集合论和布尔代数,适用于普通用户,核心是二值相关,不能进行相关性排序向量空间模型以向量表示提问和文档,向量计算在后台进行,与用户无关,优点是可以进行相关性排序,也可产生文档文摘概率模型基于贝叶斯概率论,更具有普遍性,适应多媒体、语义文档的检索,具有逻辑推理能力以上模型在实践中,常常混合使用,以达到最佳效果布尔模型
您可能关注的文档
- 修改病句课件(公开课).ppt
- 学习精细化管理.ppt
- 医院消防安全培训.ppt
- 值的形式和货币的起.ppt
- 危险品订舱须知.ppt
- 优秀PPT模板课件.ppt
- 优酷微电影简介及案例.ppt
- 外国文学-托尔斯泰.ppt
- 体育运动休闲项目建设方案.ppt
- 六年级语文上册第四单元口语交际珍惜资源.ppt
- 五个管好的意识形态工作总结.docx
- 在学校党员大会上的讲话:今年国际教育发展的四个主题.docx
- 在区廉政谈话会上的讲话.docx
- 学习贯彻2024年中央经济工作会议精神 打好政策“组合拳”保持经济稳定增长.pptx
- (7篇)学习贯彻中央经济工作会议精神研讨发言心得体会汇编.docx
- 关于“时代新人”视阈下高职思政课教学实践探究报告.docx
- (2025.01.05)关于城市营商环境现状与优化路径探索报告.docx
- 教育工作会议主题发言材料和讲话材料汇编(6篇).docx
- 镇党委副书记兼派出所所长关于2024年度民主生活会个人对照查摆剖析材料.docx
- 县委常委班子2024年度民主生活会对照检查.docx
文档评论(0)