网站大量收购独家精品文档,联系QQ:2885784924

20110606开源搜索引擎在高校图书馆的应用研究.doc

20110606开源搜索引擎在高校图书馆的应用研究.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
20110606开源搜索引擎在高校图书馆的应用研究.doc

开源信息检索技术在高校图书馆的应用研究 ——以昆明理工大学图书馆为例 孔云 杨婷 【摘 要】本文以昆明理工大学图书馆为例,从高校图书馆的角度,通过对开源技术的特点及其功能分析,探讨了开源检索技术在高校图书馆的发展与应用问题,为我国其他高校图书馆提供经验借鉴。 【关键词】开源软件 高校图书馆 信息检索 云计算 web 2.0 引言 数据、信息、知识的爆炸性增长给图书馆带来了戏剧性的挑战,但也为其发展提供了前所未有的机遇。数字图书馆的发展是对传统图书馆的颠覆,是未来图书馆生存的必然,其发展的核心问题是如何更好地对搜集、组织、检索与利用好信息资源。许多读者在面对海量信息时显得手脚无措,读者对图书馆的服务提出了更高的要求,希望能快速准确地获得所需资源;网络的发展迫使图书馆不但要为用户提供满意的数字资源,而且必须提供友好、快速的检索界面,这样才能不断地吸引读者,实现图书馆资源的最大效用。 高校图书馆发展所面临的挑战和问题 2.1商业市场的冲击 随着搜索技术的不断发展,以及搜索市场的壮大,商业搜索引擎公司不断推出数字图书馆服务。学术谷歌,百度文库,新浪爱问等系统对图书馆的侵蚀日趋明显。比如,百度与北大、中科院科学图书馆合作,开发了强大的数字图书搜索功能,在网上建立搜索平台;Google 公司凭借其大量、稳定的资金和先进的技术与众多高等院校合作,开发了大量的数字化的图书,放到网上供读者阅读。如今的搜索引擎技术日益成熟,并且逐步把图书馆的业务也融入到了搜索结果当中,用户可以在任何一个电脑终端,就可以享受到来自搜索引擎提供的有关图书和文献的信息服务。面对强大而高效的商业公司,图书馆特别是高校图书馆在自我服务定位与信息资源建设上需要进行转变。否则,随着云计算和网络技术的发展,图书馆的业务将被各大商业公司所抢占。 2.2 时代发展对图书馆的要求 知识的爆炸性增长要求图书馆必须走数字化之路。而发展数字化图书馆的核心问题是信息、知识资源的组织、检索与共享。由此可见信息检索技术是图书馆的核心技术之一,面对海量数据,知识的爆炸性增长,以及读者要求的不断提高,迫使图书馆必须提供秒级检索结果显示,才能吸引读者使用图书馆资源,爱用图书馆资源。 Web2.0概念的成熟和云计算技术的发展为图书馆为读者提供个性化,多样化的服务提供了坚实的基础。图书馆2.0的提出要求图书馆能从两个方面着手创新:一是服务创新;二是创新服务。服务创新是指在原有的服务领域,利用Web2.0 的先进技术、先进理念开展服务方式,服务手段的创新,提高服务水平。而创新服务则是需要图书馆建立自己的有关Web2.0的各种技术服务平台,为服务创新提供技术支撑,开辟新的服务领域,创建新的服务项目,为读者提供更高层次的服务。 综观国内外各大高校,其图书馆所承担的任务概要归纳为教学、科研、社会信息共享等方面。从知识无限到知识无界限,让每一个读者都能方便快捷地获取知识,了解和感受最新科技学术动态是高校图书馆的重要任务。而这些均需要读者和图书馆间的信息互动来实现。因此,信息检索技术便成为连接读者和图书馆之间的纽带和桥梁。高校图书馆能否很好吸引和服务读者,直接依赖于信息检索技术的运用是否合理和有效。 2.3 图书馆内部面临的问题 为了迎接图书馆面临的外部危机,承当历史使命,图书馆必须拥有自己的信息检索技术和创新平台。然而,据估算,一个图书馆要实现自动化,其经费预算额度一般都在几十万到几千万元之间。因各地财政情况不平衡,图书馆因经费不足从而使其自动化无法实施。经费申请,体制问题和信息技术人才匮乏等因素给图书馆自动化系统的推广带来了极大的困难和挑战 开源技术的繁荣给图书馆的发展带来福音 目前, 国外对系统开源软件的研究已经从最初的仅由一些大学和研究机构进行自由式独立研究的初级阶段, 进入到形成开源软件技术联盟进行合作开发的成熟阶段。我们完全可以吸取国外成熟的理念和技术并在国内试验和推广。 3.1基于JAVA的开源搜索引擎介绍 Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。 Apache Lucene是一个基于Java全文搜索引擎,利用它可以轻易地为Java软件加入全文搜寻功能。Lucene的最主要工作是替文件的每一个字作索引,索引让搜寻的效率比传统的逐字比较大大提高,Lucen提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,是最重要的是使使用者可以随时应自已需要自订其功能。 Zilverline是一个搜索引擎,它通过web方式搜索本地硬盘或intranet上的内容。Zilverline可以从PDF, Word, Excel, Powerpoin

文档评论(0)

wannian118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档