基于政务网搜索引擎及信息检索系统设计.docVIP

基于政务网搜索引擎及信息检索系统设计.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于政务网搜索引擎及信息检索系统设计

基于政务网搜索引擎及信息检索系统设计   摘 要: 对于政务网产生的政务信息越来越多,信息组织分散,信息结构多样的现实问题,如何统一并有效地管理是新一代搜索引擎及信息检索系统开发需要解决的问题。文章探讨了政务网信息采集和检索业务的应用目标,分析了系统的应用需求,从设计和实现的角度阐述了系统的开发思路、总体框架和主要功能。   关键词: 政务网; 搜索引擎; 信息检索系统; 政务信息   中图分类号:TP399 文献标志码:A 文章编号:1006-8228(2013)05-62-04   Design of searching engines and information retrieval system based on government network   Huang Xiaoqin   (Economic information center in Zhejiang Province, Hangzhou, Zhejiang 310006, China)   Abstract: Since information generated by government network has increased greatly, decentralized, and diversified, it is a problem how to unify and manage them effectively in the development of a new generation of search engines and information retrieval system. Application goals of government in information collection and information retrieval system are discussed. The systems application requirements are analyzed. The developing ideas, the general framework and main functions of the system are introduced from the perspective of design and implementation.   Key words: chief network; search engine; information retrieval system; government information   0 引言   近年来,随着各级政府机关网站内容的不断丰富,网页数量也呈几何式增加,由此也带来了一个结果:政府门户网站或网站群信息量巨大,缺乏一条有效的信息快速获取的途径,导致政府机关和社会公众用户在相关的政府门户网站上不知道如何快速找到自己需要或最感兴趣的内容,查询所需要的信息变得越来越困难,网络信息利用率低。鉴于此,在政务网建设搜索引擎系统,采集、处理、存储政务网上网页信息,建立网页文件信息资源库,向政府机关和社会公众提供查询服务,从而实现信息整合和有效利用,就显得比较重要和必要。   1 基于政务网的搜索引擎及信息检索系统应用目标   ⑴ 网络信息搜索采集智能化。通过采用智能化的搜索引擎技术及开发定制的产品,可以方便地实现对信息网上各类信息资源的搜索、自动跟踪与采集,自动化程度高。   ⑵ 信息分析与处理的自动化。对于采集下来的Web页面及其他格式的信息资源,系统可以通过自动分类、聚类、自动摘要、信息自动抽取及自动标引等应用技术,达到对所采集的信息内容进行自动化的分析与挖掘。   ⑶ 海量信息内容的统一管理。通过数据库仓库系统,实现对采集入库的各类格式的信息资源进行集中统一管理。   ⑷ 灵活高效的查询手段。对于采集与分析的各类Web页面库、Web页面信息索引数据库等数据库,可以方便地挂接到网站上,提供灵活多样的查询方式,满足各层次用户的实际查询的需要。   2 基于政务网的搜索引擎及信息检索系统分析   2.1 应用需求及分析   ⑴ 政务网信息资源组织和利用。通过系统的建设,在已有信息资源的基础上进一步拓宽信息资源渠道,建立完整规范的系统信息服务的信息资源组织体系,对资源的组织进行规范和整合,实现对信息服务系统资源的有效分类和管理利用。   ⑵ 政务网信息的自动采集。系统尽量依靠对口的业务信息组织人员负责信息的组织和提供维护,从技术上尽量提供方便的手段;尽量加强对已有系统中资源的利用,技术上采取自动的数据采集。通过让业务人员而不是技术人员直接完成信息的组织提供业务系统信息的自动采集,保证资源组织的效率和及时的更新。  

文档评论(0)

fangsheke66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档