- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于.Net技术图书信息全文检索系统
摘要:本文将开源全文检索技术应用到图书信息管理系统,提高了全文检索速度。最终,本文着重讨论了系统实
现的关键技术。
关键词:全文检索;图书.Net
中图分类号:J218.7文献标识码:A文章编号:1007-9599
(2023)15-0000-01
BookInformationTextRetrievalSystemon.Net
Technology
HuangJianguo
(ComputingCenter,StatisticsBureauof
Yixing,Yixing214200,China)
Abstract:Thisarticlewillopenfull-textretrievaltechnology
intolibraryinformationmanagementsystemtoenhancethe
full-textretrievalspeed.Finally,thepaperfocusesonthekey
technologiesofthesystem.
Keywords:Full-textretrieval;Books.Net
一、引言
伴随互联网技术的不停发展,信息量的迅速膨胀,使万
维网已经发展成为一种巨大的海量信息空间。现代的搜索引擎已由收录几千万到目前收录和几百亿个页面。怎样有效,迅速,精确地在海量的信息中找到我们所需要的内容已成为目前研究的一大热点。因此,信息检索技术在当今的信息社会中将发挥越来越重要的作用。全文检索则是信息检索中一种极重要的部分。人们每天在网上使用的百度,google等搜索引擎来查找所需要的信息。而这些搜索引擎采用的关键技
术就包括了全文检索。所谓全文检索是指为需要检索的内
容,例如一篇文章的标题和内容,建立索引并指明索引词出现的位置和内容。当顾客输入关键字进行查询时,检索引擎根据事先建立的索引进行匹配查找,并将查找的成果反馈给顾客的检索方式。然而,目前既有的关系数据库检索是以构造化数据为检索的。数据以记录形式存储。数据类型有构造化和非构造化之分。构造化的数据即具有固定长度的数据,例如整型、字符、日期型等。而非构造化的数据一般是寄存内容,文本等,这些数据都是不定长的。然而,对于这些非构造化数据进行检索时,一般是使用关系数据库支持的SQL语句进行匹配查询类似“like%key%”。显然,使用SQL实现的全文检索一般会占用大量的CPU和内容,使数据库处在
极繁忙状态。目前主流的数据库例如Oracle,SQLServer等
内置的全文检索技术检索效率很低,其速度也相称慢。
本文为处理既有数据库实现全文检索的局限性,运用微软的.NET技术,借助全文检索系统Lucence[1]的有关接口,实现了一种能提供全文检索的图书信息检索系统,从而大大
加紧了检索速度,提高检索精确度。
二、全文检索系统模型
本文实现一种简朴的图书搜索引擎,使用开源框架
DotLucene来实现搜索引擎系统。DotLucene是一种从Apache的Lucence检索框架移植到.Net上的。Lucene是目前最为流行的基于全文检索的工其包。Lucene检索本质上是索引检索,即采用空间来换取时间,它对需要检索的文献、字符流进行全文索引。在进行检索的时候对索引实行迅速检索,从
而得到检索的位置。
三、系统实现的原理与技术
图书全文检索系统的实现原理可分为如下几步:(1)建立图书数据库;(2)对图书库建立索引;(3)在索引数库中
实行全文搜索;(4)对搜索成果进行处理和排序。
(一)建立图书信息库
该环节是一种长期信息录入过程。假如有新的图书信息
需要入库,操作员通过系统提供的图形界面按指定的格式规
定进行数据录入。
(二)对图书库建立索引
该环节重要目的是使用DotLucene技术对图书信息库建立索引。假如使用老式的措施查询图书内容,例如具有“设计模式”的关键字,则对数据库提交类似如下的SQL语句“like%设计模式%”。这样的执效显然十分低效。本文通过DotLucene技术对需要检索的内容先进行索引,并将这些索
引信息寄存在磁盘上。在使用DotLucene类库时,首先要
在.Net系统工程引入“”动态类,并引入如下包:
usingLucene.Net.Documents;
usingLucene.Net.Index;
usingLucene.Net.Search;
usingLucene.Net.QueryParsers;
usingLucene.Net.Analysis
原创力文档


文档评论(0)