网站大量收购独家精品文档,联系QQ:2885784924

基于贝叶斯网络模型的信息检索_欧洁.pdfVIP

基于贝叶斯网络模型的信息检索_欧洁.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于贝叶斯网络模型的信息检索_欧洁.pdf

年第 期 微电子学与计算机 !# $ L# @1ABCDE=78() ?@,-A0+B,? )+-B)C03 D0E)2 ,? D0F)EB0? 9)+G,-H 1,2)3 F G ’ HIJ ! ’I广发证券博士后工作站,广州 $’J$K ! (中国科学院计算技术研究所数字化技术研究室,北京 ’LK K L M 贝叶斯网络模型是解决信息检索领域问题的有效手段,因为它可以表示术语间的条件概率和概念语 义,并依此预测用户查询和文档间的相似度。本文对信息检索中的贝叶斯网络模型做了若干改进,加入了一些新 特征,并用实验结果证明了通过提高贝叶斯网络模型的质量和调整其中的参数,我们的方法取得了较好的检索 效果。 NOPM 贝叶斯网络模型,信息检索,关联规则发现 ! ! 日益受到重视。近两年研究者们进一步研究了直 现阶段所采用的信息检索技术一般都基于布 接从数据中学习并生成贝叶斯网络的方法,为贝 尔表达式或向量空间模型 ( ),它 叶斯网络用于信息检索和知识发现开辟了道路。 ()*+,- ./0*) 1,2)3 们假设术语间相互独立,通过逻辑表达式或向量 运用贝叶斯网络模型能够帮助人类对纷繁错 间的内积反映用户查询和文档的相似度,将查询 杂、浩如烟海的无序型信息进行准确的检索、归类、 结果按相似度的降序排列后提供给用户。它们对 储存以及分析等工作,并为用户提供相关信息。真 用户的查询项进行精确匹配,因此只能反映用户 实世界是复杂的,贝叶斯网络模型则能够帮助电脑 所要检索内容的某一方面,无法保证语义概念上 建立起分析模型。 的匹配。 现有信息检索技术的检索结果与查询相关,但 #$%’()*+%,- ./ 检索质量还不够好,主要表现为:有些检索结果质 #! 012345678() 量低;检索结果集中包含与用户的查询意图岐义的 基于布尔表达式的信息检索方法构成了几乎 结果 (由于一词多义所引起);以及检索结果集中有 所有信息检索和数据库系统的基础。 大量的重复信息等。 基于布尔表达式的信息检索系统有两种类型, 除此之外,如果有的信息在内容上与用户的查 第一种系统让用户输入自己所要查询的内容,信息 询是高度相关的,但是没有使用查询词本身,例如 检索系统返回在某些字段中出现了用户的查询项 该信息使用的是查询词的同义词、近义词、高度相 的文档。这些字段由信息检索系统确定,其中可以 关词,这时,使用传统的信息检索技术不能将这些 包括标题、作者、关键词、摘要等。第二种系统要求 信息检索出来。个别时候,用户会遇到没有检索结 用户输入查询内容和出现的字段。如果有多项查询 果的情况,这时候与查询词的同义词、近义词和高 内容,那么用户查询词用布尔操作符 “与”( )、 89: 度相关词相关的信息可能是用户所需要的,检索系 “或”( )、“非”( )进行连接,信息检索系统返 ;

文档评论(0)

ziyouzizai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档