- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图书馆云计算可行性的研究
图书馆云计算可行性的研究
〔摘要〕从海量数据处理、高并发访问和竞争主体多元化3方面阐述图书馆云计算需求。采用统计分析法研究基础设施、资金投入、技术人才和用户接入条件。采用对比分析法将云计算方案分为商业云和开源云,提出基于Eucalyptus的服务器整合、基于MongoDB的高性能网站和基于Hadoop的个性化推荐系统3种典型方案。从初始投资成本、运维成本和扩展能力3个角度评价图书馆云计算效益。
〔关键词〕图书馆;云计算;可行性;分布式;虚拟化;解决方案;效益评价
知识经济时代,创新是发展的动力。图书馆作为科学研究支撑机构承担着信息保障职责。数字资源增长为图书馆信息化建设提出了挑战。传统建设采用一次性投入方法,资金投入表现出明显的周期性。巨额初始投资是图书馆数字资源服务建设的主要障碍之一。为了解决高端硬件价格昂贵,扩展性不足的问题,产生了云计算模式。通过廉价设备,设备购置从集中转为分散,在成本和扩展性方面具有明显优势。一些国外图书馆已经开始采用云计算模式[1],例如美国俄亥俄图书馆与信息网络(OhioLINK)使用AWS托管数字资源;科罗拉多州西部州立大学采用Google App架设服务;OCLC从2010年开始提供基于云计算的协作管理服务。鉴于云计算的广泛应用价值,我国科技部于2013年9月发布“中国云科技发展十二五专项规划”,提出以需求为导向发展自主可控的云计算技术[2]。本文研究图书馆采用云计算的技术需求、建设条件、建设方案和效益评价,希望为相关建设提供参考。
1图书馆云计算需求分析
11海量数据处理
在信息化社会,科学研究、物联网和互联网领域正在产生海量数据。据统计,美国研究图书馆协会(ARL)的110家成员每年花费数亿美元采购电子资源。我国截至2005年在线数据库达到30多万个。中科院拥有自建数据库388个,容量达13TB。图书馆每年加工的数字化文献达数千万页,平均每个图书馆拥有4个自建数据库。科学研究进入了数据密集型阶段,除了数据规模海量增长外还表现出分布、异构、低质量的特征。多核处理器、GPU计算、FPGA(现场可编程逻辑器件)以及每秒计算速度超过千万亿次的高性能计算设备在一定程度上缓解了海量数据处理压力。除了硬件技术的进步,计算模式的变革对于解决海量数据处理问题具有更为重要的意义。并行计算、分布式计算以及数据流等技术克服了单一节点计算能力的不足,适合海量非结构化数据处理[3-6]。
12高并发访问
图书馆信息系统面向广大读者,并发访问能力是影响服务范围和用户体验的关键因素。采用通用成熟方案能够降低技术风险,但在高流量下会遇到各种瓶颈,通过升级硬件一般不能满足需求。采用IBM等大公司定制的解决方案需要采购大型机,支付软件使用费及各项技术专利费用。一些企业采用自主研发方式,例如淘宝等电子商务企业,但这种方式仍需要投入巨大的资金和技术力量。大型分布式系统依据CAP理论和BASE原则。高并发访问是高性能和高可用的兼顾,是在系统性能达到极限的情况下为尽可能多的用户提供稳定服务。图书馆分布式系统可以在保证最终一致性条件下降低任意时刻一致性。采用SSD、SAS、SATA等读写速度有差异的设备混合搭配,判定和迁移热点数据提供分层存储。NAS架构下通过MemCached分布式缓存能有效降低数据库负载[7-9]。
2014年7月第34卷第7期现?代?情?报Journal of Modern InformationJuly,2014Vol34No72014年7月第34卷第7期图书馆云计算可行性研究July,2014Vol34No713竞争主体多元化
依据波特的竞争战略分析模型,图书馆可以视为具有非营利性和依附性特征的一类企业。其服务不产生盈利,成本来自社会投入。近年来同类机构例如博物馆、档案馆、网络中心和计算机中心等和图书馆在用户和投入资金方面形成了竞争。信息娱乐业、网上书店、搜索引擎等营利性机构通过对信息资源进行开发、管理、经营获取收益,对图书馆的用户产生了分流作用。书刊出版发行商、数据服务商、自动化系统厂商等上游机构随着文献信息量的激增,除了将价格提高以外直接向最终用户提供服务,使图书馆处于不利地位。面对严峻的竞争形势,图书馆在数字资源建设和服务方面应采取差异化竞争、资本领先、联盟共建共享以及个性化服务等措施,提高运营效率改善用户体验。云计算最初产生于网络企业主要原因是为了节约成本提高效率。网络企业作为技术密集型企业数量众多,成本差异决定企业能否生存以及竞争能力高低。廉价和高效云计算技术同样是面临多元化竞争的图书馆的必然选择[10-12]。
2图书馆云计算建设条件
21基础设施
随着数字资源的增长,大多数图书馆采购了服务器、磁盘阵列、交换机等设备。20
原创力文档


文档评论(0)