去伪存真去粗取精页面质量评估及其在网络信息检索中的.pptVIP

  • 0
  • 0
  • 约5.93千字
  • 约 48页
  • 2017-02-20 发布于上海
  • 举报

去伪存真去粗取精页面质量评估及其在网络信息检索中的.ppt

去伪存真去粗取精页面质量评估及其在网络信息检索中的

去伪存真 去粗取精 ——页面质量评估及其在网络信息检索中的应用 马少平 刘奕群 清华大学计算机科学与技术系 智能技术与系统国家重点实验室 2006年7月,山东,济南 去伪存真 去粗取精 问题背景 页面质量评估的相关工作概述 高质量页面的查询无关特征分析 基于学习的页面质量评估算法 应用展望 去伪存真 去粗取精 问题背景 页面质量评估的相关工作概述 高质量页面的查询无关特征分析 基于学习的页面质量评估算法 应用展望 问题背景 World Wide Web的出现与发展 问题背景 Web蕴含着多少信息? How Much Info 工程 由Intel, Microsoft, HP, EMC等公司赞助,UC Berkeley大学完成 2002年世界上共产生了5Exabyte的数据,其中92%的信息存储于电子介质 相当于人类历史上所有说过的话语 所包含的信息量的总和 大部分存储于Web中,构成了Web 中超过150Billion的网络页面 问题背景 Web的发展带来了什么? 信息数量的急剧膨胀 知识的获取空前简单与繁荣 Information is no longer a scarce resource - attention is. (注意力,而不是信息,才是这个时代所稀缺的资源 ) (纽约时报,2005年10月16日) 在信息化时代,知识实际上已经不是资源,智慧

文档评论(0)

1亿VIP精品文档

相关文档