- 6
- 0
- 约9.57千字
- 约 6页
- 2017-08-11 发布于重庆
- 举报
大容量XML数据存储搜索策略研究.pdf
大容量XML 数据存储搜索策略研究
张俊
北京邮电大学信息网络中心,北京 (100876)
E-mail: zhangjunhd@
摘 要:因特网给我们提供了巨大的信息量,在信息量极其丰富的Web 资源中,蕴涵着大量有
用的知识信息。信息爆炸而知识匮乏是当今人们所面临的一个很重要的问题。通过搜索引擎
来查找信息将不容易定位到用户最感兴趣的数据上。而通过Web 信息抽取的自动化实现,可
以提高信息获得的效率。信息抽取可以从网络上分析和发现有用的信息,废弃冗余的数据,提
取用户知识领域的知识。随着越来越多用户采用 XML 标记,将出现搜索和处理XML 数据
时所带来的新课题。本文针对这一背景,讨论了在处理大容量XML 数据,为其建立搜索引
擎时,所涉及的流程、问题和改进策略。
关键词:XML ;搜索引擎;存储;检索
中图分类号:TP311.13
1. 引言
最初设想的可扩展标记语言 (X
原创力文档

文档评论(0)