- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
专题2数字标本馆与生物多样性信息管理.PDF
专题 2 数字标本馆与生物多样性信息管理
中国虚拟植物标本馆标本集成检索系统设计与开发
陈建平
(西北农林科技大学生命学院植物标本馆,西安杨凌 712100)
集成检索,也称为元检索、集成检索、跨库检索、并发检索、广播检索、联邦检索等。
是一种分布式异构数据库间的系统集成技术。
“中国虚拟植物标本馆集成检索系统”是由中国虚拟植物标本馆 CVH 支持的一个探索性项
目。旨在通过统一的检索界面,同时对多个标本馆的标本数据库进行检索,并将检索结果归
并,一次提交给用户,在实体资源分散的情况下实现了“虚拟的资源整合”。 由于国内各植
物标本馆数据基本都交与 CVH 作数据集中式集成,本项目则主要致力于国外标本馆的数据集
成,采用分布式的虚拟集成策略。
实现方案有两种:
1. 在线多代理方式:它向用户提供统一的检索接口,将用户的检索要求转化为不同数据源
的检索表达式,并发地检索本地的和广域网上的多个分布式异构数据源,并对检索结果加以
整合,在经过去重和排序等操作后,以统一的格式将结果呈现给用户。其特点是:
● 能及时反映数据源最新情况。
● 系统仅有程序,无需数据库,部署方便简单。
● 无须处理具体数据库,工作量小。
● 因为所有过程都需要在线处理,所以响应速度慢,服务器压力大。
● 检索系统受限于各个标本馆的网络服务状况,对方网络地址变更、应用系统更新、服
务器关闭等等情况都会引起检索无效。
● 查询结果的集成度低。因为数据源返回的结果往往都是分成多页的,在线处理时不可
能等到所有数据后再分析、综合。
2. 搜索引擎方式:先使用网络机器人(Robot,或称为网络爬虫 Spider)缓冲数据源,其
次对数据源进行分析,最后重建索引数据库,建立检索系统。在标本集成检索系统中,系统
将按照物种词典预先检索各个数据源,将结果处理后缓冲在本地。接受用户检索请求后直接
在本地执行检索,返回数据。特点是
●响应速度快。
●查询结果的集成度高。可以按照任意的要求对数据进行整理排序。
●不受数据源的网络状况、服务器错误等意外情况干扰。
●节省带宽资源,服务性能好。
●不能反映数据源最新情况,只适用于数据变化周期较长的情况。需要定期更新缓冲。
●需要分析每个数据源,作数据抽取的工作,工作量大。
目前的系统按照第一种方案设计,即“在线多代理方式”,已经可以检索数十个数据源。
也实现了.NET 平台下的网站自动登陆模块,代理访问模块。同时我们也对第二种方案(即
搜索引擎方式)进行了研究,开发出了 Spider、网页数据分析提取工具等核心工具。
一个生物标本地理信息系统的设计和实现
Design and Implement of a Specimen-Geographical Information System
张尚武
(中国科学院动物研究所,北京 100080)
作者在调查 GIS 技术在生物多样性研究领域的应用时发现,现有的 GIS软件功能复杂,
价格昂贵,仅适合既具备一定 GIS 专业知识又具有计算机技术相关知识的研究人员使用。这
使得生物多样性研究的人力和物力成本大幅增加。而作为发展中国家的中国在生物多样性研
究领域的投入有限,使得 GIS 技术在我国生物多样性研究领域上的应用滞后于国际同行。另
一方
文档评论(0)