- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于GIS 数据库信息的面向某一行业的信息检索系统
的设计与实现1
林祥涛,彭泳
北京邮电大学计算机科学与技术学院,北京(100876)
E-mail :xtlin@
摘 要:本文在分析当前的信息检索系统优缺点和GIS 数据库信息特点的基础上,利用GIS
数据库信息分类明确的优势,提出了一种面向某个行业的信息检索系统,它因为专用性而具
有较好的性能。本文以面向餐饮业的“搜饭” 系统为例,详细讲述了这种信息检索系统的设计
思路与实现方案。
关键词:信息检索,GIS ,基本库,扩展库,搜索引擎
中图分类号:TP31
1. 引 言
毫无疑问,人类社会已经进入了信息时代,“信息爆炸”这一词汇也已经被它所谓的爆炸
的信息引用过无数次。人们还没来得及为获取信息的便捷而欢呼就马上被膨胀的信息所淹
没。在某些情况下,收集有用信息所花费的成本已超过了信息本身的价值。如何有效利用信
息资源,提高收集信息的质量,已经成为一个世界性难题。它的解就是信息检索。
信息检索是从相关文档中返回满足用户需求的相关信息的过程,它涉及到信息的获取,
信息的表示,信息的存储,信息的组织和信息的访问等相关方面。据此,搜索引擎是狭义上
的信息检索。当前主要的搜索引擎如google,百度都没有首先对搜索的数据进行很好的分类,
仅仅使用 rank 算法来排序搜索出的结果,因而缺少了针对性,命中效率不高。因此,建立
面向某一行业的专门的信息检索系统将会大大提高检索效率。
通过观察GIS(Global Information System)信息数据库,我们发现它的信息有着明确的分
类,分为饭店,商场,医院,学校和宾馆等。因此,可以对GIS 信息数据库进行信息检索,
以建立针对某一行业的专门的信息检索系统,例如搜索饭店的信息检索系统。
2. 系统架构设计
本文以建立搜索饭店的信息检索系统为例来研究此类系统的架构。经过上面的分析,我
们倾向于使用当前流行的B/S 架构。系统架构如图:
1本课题得到国家自然科学基金的资助。
-1-
图1 系统架构图
像当前主流的搜索引擎一样,Web browser 用于向用户呈现系统的使用界面和展现系统
查询的结果。Server 侧主要是一个搜索引擎,用于搜索从GIS 数据库导出的文件系统。这个
文件系统是按照 GIS 数据库信息的分类方法而导出的只包含饭店信息的文件系统。由于这
个向用户提供“搜饭”功能的搜索引擎要搜索的数据只包含饭店信息,因此,与面向整个因特
网的主流搜索引擎如 google 相比,它具有很强的针对性,是专门为“搜饭”服务建立的,对
于“搜饭”结果来说,它的命中率大为提高。
通常图 1 中的GIS database 中包含的关于饭店的信息只是关于某饭店的空间数据,例如
地址,电话,饭店名称以及对该饭店的简单描述信息如特色菜、星级等信息,而缺少该饭店
的更加详细的信息,例如是否有停车场,饭菜价位,优惠政策等。针对这一问题,有两种方
案供选择:一是直接扩展 GIS 数据库,在数据库中直接为某饭店增加关于这些信息的对应
字段(field )。这样做的感觉很直观,便于理解,然而增加了系统的耦合度,使系统难于扩
展,并且稍后还会看到,为了保证用户总是查询到最新的信息,一旦数据库进行了扩展,就
需要重新导出记录到文件系统,再对文件系统建立索引,需要花费大量的时间和物力;一是
由饭店建立一个独立的数据库,由饭店来维护自己的更加详细的信息。我们称原来的 GIS
数据库为基本库,这个独立的数据库为扩展库。基本库与扩展库的纪录(records )通过主键
(primary key )关联即扩展库中纪录(records )的主键与基本库中关于该饭店的纪录(records )
的主键(primary key )相同。这样,可以在维持基本库不变的情况下随意的改变扩展库,降
文档评论(0)