- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
专家检索研究综述
[摘要] TREC 2005增加了企业检索任务(Enterprise Track)并设立了专家检索子任务,为专家检索方法和技术的经验性评价提供了平台,并着重从专家检索算法、模型和评价方法等几方面进行了探讨,极大地促进了专家检索研究的发展。本文即是在此背景下,对近年来专家检索研究的进展和现状进行的系统总结。本文分别从专家检索的数据集来源、专家检索方法、专家检索的排序方法、专家检索的效果评价这四个方面对专家检索的相关研究进行了介绍和评述。
[关键词] 专家 专家专长 专家档案 专家证据 专家检索
[Abstract] Since TREC 2005 established Enterprise Track and Expert Search sub-task, a common platform has been provided for researchers to empirically assess methods and techniques devised for Expert Search. The algorithms、models、evaluation and other aspects have been particularly discussed for Expert Search, which has greatly facilitated the development of the Expert Search Field. Based on this context, this paper systematically summarizes the progress and current situation of research on Expert Search..This paper introduces and observes the research related to Expert Search from the four aspects: the source of data sets、Expert Search methods、ranking algorithm and effectiveness evaluation.
[Key words] Expert Expertise Expert profile Expert evidence Expert search
1 引言
进入21世纪,人类社会正在由信息社会迈向知识社会,掌握一定知识、经验和技能的人才将会成为企业和组织最宝贵的资源。各领域的专家是该领域知识的代表,所拥有的丰富且最新的该领域的专业知识、技能和经验是企业生存和发展的最关键因素。目前,一些企业和组织,为了提高自身的竞争优势,已经或者正在建立专家检索系统,利于有效地管理专家资源。
专家检索(亦称之为专家查询,专家推荐,专长定位,专长识别[1])作为实体检索的一
个特例,它要求返回的实体类型是具有特定专长(与查询主题相关的)的专家。由于专家检索在促进知识共享和交流,构建学术界和产业界的桥梁,知识管理等方面有重要的应用价值,近年来专家检索引起了学术界广泛兴趣。
作为web track的后继项目,TREC(Text REtrieval Conferences)于2005年增加了企业检索任务(Enterprise Track),并设立了专家检索子任务。该子任务可以描述为:给定文档集,查询主题集和专家列表,并从这些专家列表中为每个查询主题查找相关专家。自设立专家检索子任务后,TREC为专家检索的方法和技术进行经验性评价提供了一个公共平台,近几年来,分别对专家检索算法、模型和评价进行了探讨,促进了专家检索领域的发展。
关于专家检索的任务,Yimam-Seid等[2]界定为以下两个方面:查找具有某专长的专家和查找专家所具有的专长。目前,检索界所探讨的专家检索一般是指前一个方面。本文所探
讨的专家检索也是指查找具有某专长的专家,故本文中的专家检索主要任务可以描述为:利用企业或者组织内外能够表征专家专长的各种文档和资源,如电子邮件、 报告、 数据库文件和网页等,识别专家在某给定查询主题 (领域)的专长 (相关性 )程度,并按程度高低排序显示专家结果列表的过程[3]。
本文组织如下:第二节介绍用于专家检索的数据集来源,第三节介绍专家检索的方法,第四节介绍专家检索排序,第五节介绍专家检索结果的评价,最后第六节对本文工作进行简要总结。
2 专家检索的数据集来源
一般来说,要实现专家检索需要两个必要条件:即专家列表和包含专家专长信息的数据集[4]。其中,数据集来源可以分为以下三类:
(1)传统数据库
专家检索的最初数据来源就是在组织中用一个数据库存贮每个
文档评论(0)