面向语义Web的分面式实体搜索和推荐方法研究.pptx

面向语义Web的分面式实体搜索和推荐方法研究.pptx

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
面向语义Web的分面式实体搜索和推荐方法研究提纲研究背景实体的分面式搜索基于伪相关反馈的实体推荐实验评估总结与展望研究背景结构化数据丰富实体搜索需求巨大关键词匹配的局限性用户搜索意图的不确定性研究内容实体的分面式搜索基于伪相关反馈的实体推荐实体的分面式搜索?问题描述是实体的集合,实体是一个或多个类型的实例。是实体集合的类型集合,对每一个类型,用表示它的实例集合,类型含有层次结构,子类-父类关系用符号表示。采用Isub计算两个类型的相似度,超过阈值则认为它们是一个类型,如FilmDirector与ShortFilmDirector。类型分面(Facet)是一个类型,对于实体集合,。表示它的实例集合。在一组类型分面上含有层次结构。 Falcons 实体搜索系统搜索“Steven Spielberg”得到的结果实体及对应类型实体 Entity类型 ClassSteven Spielberg (Director)/resource/director/8477Thing, Resource, SpatialThing, SocialEntity, Agent, Person, directorSteven Spielberg (Editor)/resource/editor/2324Thing, Resource, SpatialThing, SocailEntity, Agent, Person, editorSteven Spielberg (Actor)/resource/actor/29646Thing, Resource, SpatialThing, SocialEntity, Agent, Person, actorSteven Spielberg/resource/Steven_SpielbergThing, Resource, SpatialThing, SocialEntity, Agent, Person, EntitySchindlers List /resource/Schindlers_ListThing, Resource, Work, Movie, Film, Entity, CreativeWorkSaving Private Ryan/resource/film/38133Thing, Resource, filmA.I./resource/film/334Thing, Resource, filmThe Terminal/resource/film/39887Thing, Resource, film?{Thing, Resource, SpatialThing, Agent, Person, editor, actor, director, Entity, Work, Movie, Film, CreativeWork}?为film,{ Saving Private Ryan, A.I., The Terminal, Schindlers List }??基于上述模型,描述分面式搜索问题如下,输入:RDF三元组集合,类型层次结构和查询 输出:查询结果和一组类型分面例如,用户输入查询为“Steven Spielberg”,并且选择类型分面为“film”。系统返回输出为一组实体集合,如{Saving Private Ryan, A.I., The Terminal, Schindlers List},并且重新计算类型分面集合为{Movie,CreativeWork}。?分面的选择给定的实体集合和其对应的一个分面,定义3种度量指标(频繁度、信息量和相关度)来衡量分面的不同特性。基于覆盖率的考虑,即选择前K个分面覆盖尽可能多的实体。将三个度量综合考虑并将此问题映射到一个基于Budget Maximum Coverage(BMC)的问题。分面度量频繁度信息量相关度?基于BMC的分面选择BMC问题:是覆盖了元素集合的元素子集的集合。每一个集合都有一个代价,同时每一个元素都有一个权重。问题的目标是找到一个集合,使得的代价不会超过一个给定的预算,同时要求包含的元素的权重最大。在本文的上下文中,每一个分面都可以被认为是一个集合,所有的实体都是的一个元素。选择“film”分面后过滤的结果关键词查询“Steven Spielberg”的部分搜索结果基于伪相关反馈的实体推荐相关反馈显示相关反馈二元:relevant,irrelevant多级:bad,fair,good,excellent,perfect隐式相关反馈点击,浏览,鼠标滚动,停留时间伪相关反馈假设检索系统根据查询反馈的前K个文档是相关的基于全局文档基于局部文档局部伪相关反馈在一般情况下,排序靠前的文档中存在噪音:如果前10位结果中的准确率(P@10)是0.5,那

文档评论(0)

benzei244572 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档