文本信息检索技术.docVIP

  • 4
  • 0
  • 约4.01千字
  • 约 5页
  • 2017-03-03 发布于湖北
  • 举报
期末课程论文 论文标题:基于文本信息检索技术 课程名称:信息检索技术 课程编号:1220500 学生姓名: 学生学号: 所在学院:计算机科学与工程学院 学习专业:计算机科学与技术 课程教师: 2013年7月 4日 文本具有与平台无关、支持基于内容的联想式超链接信息组织方式以及多媒体化的人机界面,因此成为Interact上信息组织、存储与发布的主要方式之一。但是,由于文本是一种非结构化文档,一般仅适合于信息的浏览和导航,而无法像数据库那样实现基于主题、关键词、内容等的信息检索。其次,一张主页至少对应一个以上的文件,当信息规模较大时,不仅文件数量巨大,而且文件间存在的错综复杂的链接关系也难以维护.在数字化图书馆、多媒体课件资源以及ICP(Intemet ContentPmvider)网站构造等应用中,这种情况尤为突出.因此,如何实现超文档的规范化管理,并提供基于主题和全文的检索功能,已经成为数字图书馆、多媒体远程教育中课件资源管理以及ICP服务的一个重要问题。 目前,实现文本信息的全文检索,一般有以下两种解决途径:① 采用Web服务器自带的索引服务器,如Microsoft IIS自带的Index Server,这种方法只能实现字符串匹配查询,无法实现按主题查询,效率低下,无法跨平台,也无移植性;②通过将非结构化的文本文件集转换成

文档评论(0)

1亿VIP精品文档

相关文档