Web检索查询意图分类技术综述.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维普资讯 第 22卷 第 4期 中文信息学报 Vol|22,No.4 2008年 7月 JOURNALOFCHINESE INFORMATION PROCESSING Jul_,2008 文章编号:1003—0077(2008)04—0075—08 Web检索查询意图分类技术综述 张 森 ,王 斌 (中国科学院 计算技术研究所 ,北京 i00190) 摘 要 :查询分类是近年来信 息检 索领域 的研 究热点,并且在很 多领域得到 了广泛地关注。主要讨论根据查询 的意 图进 行分类的研 究工作 ,从查询 分类 的诞 生背景 、关键技 术 、所使 用的分类方法和评 价 方 法方 面进 行 综述评 论 ,提 出了查询意 图分类面临的问题和挑 战。认为缺乏权威的评测标准 、在 大规模数据集上 的未经全面测试 的 性能 、如何 准确地 获取查询 的特征 以及如 何证 明分类 体 系的 完备 性 和独 立性是 目前 查询意 图分类研 究 的关键 一~~~~一一一~一一一一一一.一一一一一一一一一一~一一~~~~一一~一一一一一~一一一一一~一一一~~一一一~一一一一 问题 。 关键词 :计算机应用;中文信 息处理 ;自动查询分类 ;查询意 图分类 ;分类方法;数据集 ;特征提取 ;机器学 习 中图分类号 :TP39l 文献标 识码 :A 一一~一一~一一一一一~一~m一一一一 知所措 。搜索引擎 的m现在一定程度上缓解了针对 l 引言 海量信息的浏览和查找的难度。甚至可 以说 ,搜索 引擎就是网络 的入 口,Web用户可以通过 向搜索 引 随着互联 网的发展 ,WorldWideWeb(以下 简 擎提交 Web查询来使用这个入 口。web查询 (以 称 web)上 内容越来越多 ,充满 了各种各样 的信息 。 下简称 “查询”)特指那些被提交给网络上 的搜索引 这些信息以包括传统 网页、格式化文档、媒体文件 擎 、用以满足某些特定需求的查询 。 (图片、音频、视频)、网络 目录、用户档案 、各种讨论 另外需要注意的是 ,互联网上用户的查询行为 区、邮件列表 、blog等在 内的多种形式呈现 。因此 具有不可预测的特点。在 目前由搜索引擎所提供的 从 网络上信息的功能和存在形式来说 ,网络 中的信 交互接 口和服务决定 的条件下 ,用户往往 只能使用 息集合是一个异构的集合 ;而且 网络上 的信息越来 有限数量 的词汇来抽象和概括他们的需求 。这个从 越多,这使得用户在面对如此海量 的信息时往往不 信息需求到形成查询然后提交给搜索 引擎 的过程见 收稿 日期 :200709—16 定稿 日期 :2007一ll一23 基金项 目:国家 自然科学基金 资助项 目;国家 973课题资助项 目(2004CB318109) 作者简介:张森 (1983一),男,硕士生 ,主要研究方向为文本信息检索;王斌 (1972一),男,博士 ,副研究员 ,主要研究方 向 为信息检索和 自然语言处理 。 维普资讯 76

文档评论(0)

ganpeid + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档