Web信息采集系统的设计与实现.docx

基于主题的 Web 信息采集系统的设计与实现 李盛韬,赵章界,余智华 (中国科学院计算技术研究所 软件研究室,北京 100080) 摘 要: 基于主题的 Web 信息采集是信息检索领域内一个新兴而有实用价值的方向,也是信息处理 技术中的一个研究热点。本文分析了主题 Web 信息采集的基本问题,提出了难点以及相关的解决方案, 并在此基础上设计实现了“天达”主题 Web 信息采集系统。 关键词: 信息采集;信息检索;信息处理;主题 Email: lishengtao@ ; zhaozj@ ; yzh@ 中图分类号: TP391 文献表示码: A 基金资助: 中科院计算所领域前沿青年基金资助 (资助号 8 ) Design and Realization of Focused Web Crawler LI Sheng-tao, ZHAO Zhang-jie , YU Zhi-hua (Software Division, Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100080, China) Abstract:

文档评论(0)

1亿VIP精品文档

相关文档