目录 - 清华大学智能技术与系统国家重点试验室信息检索组.pdf

目录 - 清华大学智能技术与系统国家重点试验室信息检索组.pdf

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
目录 - 清华大学智能技术与系统国家重点试验室信息检索组

目 录 目 录 第一章 引言 1 1.1 研究目的、意义及研究背景 1 1.1.1 信息检索的基本概念与发展历史 2 1.1.2 信息检索系统的运行原理 4 1.1.3 信息检索系统的性能评价 6 1.2 网络信息检索的基本概念 7 1.2.1 网络信息检索系统的组成 8 1.2.2 超链接结构分析的形式化基础 12 1.2.3 HITS算法基本思路及实现13 1.2.4 PageRank算法基本思路及实现16 1.2.5 链接分析算法总述 17 1.2.6 网络信息检索系统的性能评价 18 1.3 面向网络信息检索的用户行为分析概述 21 1.3.1 用户群体行为分析的研究历史 21 1.3.2 用户查询行为的宏观统计分析 22 1.3.3 用户查询信息需求分析 23 1.3.4 针对特定检索用户群体的行为分析 24 1.4 课题研究重点及主要工作 24 1.4.1 用户交互方式与网络信息检索系统的发展 24 1.4.2 网络信息检索系统的信息处理困境 26 1.4.3 本文研究重点:基于用户群体行为分析的网络信息检索 27 1.5 论文各部分的主要内容 28 第二章 基于用户群体行为分析的网页质量评估算法研究 30 2.1 引言 30 2.2 相关工作 31 2.2.1 宏观粒度网络数据质量评估技术 31 2.2.2 微观粒度网络数据质量评估技术 33 III 目 录 2.2.3 冗余页面识别技术 35 2.2.4 网络数据质量评估方式总述 36 2.3 用户信息需求与网页质量的定义 37 2.4 查询目标页面与普通页面的特征差异 39 2.4.1 特征分析的实验设定 39 2.4.2 文档长度特征的差异 41 2.4.3 链接文本长度的差异 42 2.4.4 PageRank特征的差异43 2.4.5 入链接个数特征的差异 44 2.4.6 出链接个数特征的差异 45 2.4.7 站点内出链接个数的差异 46 2.4.8 URL长度特征的差异47 2.4.9 查询目标页面的查询无关特征总结 48 2.5 基于查询目标页面定位的网页质量评估 49 2.5.1 查询目标页面定位问题的困境 50 2.5.2 基于分类方法的网页质量评估及其局限性 51 2.5.3 基于贝叶斯学习方法的网页质量评估 54 2.6 网页质量评估性能实验 56 2.6.1 性能评价指标 56 2.6.2 实验设定 59 2.6.3 网页质量评估实验 61 2.6.3 页面质量评估算法对检索性能的影响 64 2.7 本章小结 68 第三章 基于用户群体行为分析的用户查询行为研究 70 3.1 引言 70 3.2 网络信息检索用户行为特性 71 3.2.1 用户用多少词来表示查询需求 72 3.2.2 用户是否修改他们的查询 72 3.2.3 用户行为特性对查询处理的影响 73 3.3 研究背景:查询分类在网络信息检索中的作用 74 3.4 用户查询需求的特征分析 75 IV

文档评论(0)

wangyueyue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档