《中文文本信息处理》课件第十三章信息检索.pptVIP

下载本文档

15
0
约1.08万字
约 92页
2018-01-28 发布于江西
举报

《中文文本信息处理》课件第十三章信息检索.ppt

中文文本信息处理的原理与应用基于NLP的方法实例问天IR系统地址：/product_yanshi.html 检索词扩展中文文本信息处理的原理与应用主要内容信息检索(Information Retrieval)的基本概念信息检索的一般模型基于语义的信息检索方法基于Web的信息检索相关会议及工具介绍中文文本信息处理的原理与应用基于WEB的IR WEB页面的特点 Web数据本身的特点 Web数据来源广泛，结构性差而且数量庞大(很多地方以海量来形容Web数据) 内容亦是良莠不齐用户检索行为的特点 Web信息查询可以分为如下三类: 普通信息查询精确信息查询相似信息的查询中文文本信息处理的原理与应用 WEB页面的特点(续1) Web页面特点页面中链接多超链接作用大网页以网站为单位组织 Web页面的多样化中文文本信息处理的原理与应用搜索引擎的工作原理三步: 从互联网上抓取网页建立索引数据库在索引数据库中搜索排序中文文本信息处理的原理与应用搜索引擎的搜索机制 Google为例功能上同样可以分为三大部分: 网页抓取索引入库用户检索中文文本信息处理的原理与应用 Google总体系统结构 URL服务器索引库抓取器存储服务器 URL解析器锚库资源库 Web页搜索链接库

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

《中文文本信息处理》课件第十三章信息检索.pptVIP