? ? ? ?
? ? ?
银行数据中心高端存储选型的方法论
? ? ?
?
?
?
?
? ? ?
? ? ?
?
? ? ?
?
?
?
一、前言
存储设备作为银行数据中心内最关键的硬件资源,其重要性不言而喻。随着数据中心发展规模的不断壮大,存储设备升级扩容、更新换代甚至是存储架构的整体变革是存储工程师工作内容中重要的一环。本文通过对存储选型自身的需求分析、存储选型指标体系的设计建立以及最终进行存储产品的选型指标参数对比方面进行阐述,希望能对存储工程师在存储选型工作上提供一定的方法论和经验指导。
二、背景
作为存储管理员的你在向领导汇报了目前数据中心存储老旧、故障率高、容量不足、品牌众多、管理繁琐后,领导给你下达任务了:“小X啊,看来我们的存储架构需要升级扩容了,你去做一下存储的选型分析报告交上来我看一下。”于是乎,选择题摆在了面前,该推荐哪个品牌的哪款型号的存储呢?IBM、HDS、EMC、华为?HDD、SSD、NVMe?两控or四控,是否需要支持四控三坏?存储双活架构、两地三中心异步复制,其他软件特性是否需要支持……作为技术人员,脑海中冒出的首先是这些参数规格或者产品特性,那么该如何有条理有体系的开展一番存储选型工作呢,下面将为大家一一道来。
三、存储选型需求分析
在开展存储选型工作之前,需要制定一套存储指标考量体系,而建立这套体系的前提是对自身存储使用的需求进行充分剖析,从中提炼出必须满足的基本项和可选的加分项,为接下来制定指标体系做准备。根据我们存储使用和维护的多年经验,存储采购时需要考虑的需求基本上包含在以下各个方面。
(一)稳定性
对金融行业尤其是银行的数据中心而言,数据存储动一发而牵全身,存储架构的稳定性和可靠性是数据中心存储选型最基本也是最重要的需求。稳定性和可靠性体现在几个方面,一是存储架构冗余度高,各个部件均为冗余设计、支持热插拔,任意部件损坏均不影响主机上业务运行;二是存储设备的可维护性高,各个部件的维修和更换均为在线操作,控制器、硬盘、接口卡等部件都能在线升级微码,轮流重启时不可以影响到上层业务。
(二)产品架构
选择集中式存储还是分布式存储是当下做存储选型时的一大热门话题。集中式架构的存储采用的块机制,以块为单位实现数据的更新和锁机制,其机制跟数据库管理数据文件的方式可以说是比较协同一致,那么性能及安全也就自然可以保障。这也是大家选择它那么多年的理由。分布式架构现在常见的有两种做法,一种是基于对象存储机制实现的分布式架构,一种是基于分布式文件系统实现的分布式架构。对于这两种架构的选择,需要结合上层应用配套考虑。
对于高IO同时对时延敏感的核心或者其他重要系统,高吞吐低时延的集中式高端存储更为合适,安全性和稳定性也经过多年磨练。同时,现在企业级高端存储内部架构都是支持在线横向、纵向扩展的,因此从某种意义上来说也是分布式。企业级高端存储既具有分布式特性又具有集中管理的优势,可以说是分布式集中存储。本文接下来的讨论内容也以集中式存储为主。
(三)性能
对银行数据中心而言,存储建设事关重大,一旦建设完成,需要保证至少 5 年内上层应用不出现存储层的性能瓶颈,随着闪存技术的快速发展,目前全闪存存储已经成为各家主流存储厂商的标准配置,同时结合控制器和硬盘框的NVMe技术应用,IOPS已经从传统机械硬盘存储的几万、十几万,上升到几百万级别,性能得到极大提升,因此在如今形势之下采购新存储时,全闪存储已成为首选,如果成本可以承受,配备NVMe SSD的全闪存储是最佳选择。
(四)可扩展性
存储设备必须具有灵活的体系架构,随着容量需求的增加可以按需进行在线扩容,包括存储柜内的纵向扩容和多柜的横向扩展,扩展之后实现存储资源的在线自动平衡。
以机械盘为数据载体的上一代存储容量小、可扩展性差。而随着存储技术的飞速发展,硬件层面上闪存盘的普及使得单台高端全闪存储的性能和容量极大提升,再结合控制器在线横向扩容等技术的应用,单套存储架构的可用容量达到PB级别,基本能满足大行的某套应用或者中小银行的数据中心未来五年的容量需求。
(五)容灾能力
存储架构的容灾能力指的是本身高可用性之外对于各个灾备特性的支持,包括存储层双活以及两地三中心架构的支持度,双活仲裁机制是否可以保证常见故障场景下业务的连续性和数据不丢失。
(六)标准容量下的成本
对于银行来说,高端存储选型一个重要的参考就是单位TB 可用容量下的成本,能够花更少的钱买到更多的容量,一定是我们采购过程中的一个重要指标,这就对存储设备的架构能力和存储厂商的商业模式提出了一定的要求,最终的选择需要根据客户实际情况去做抉择。
计算成本时除了硬件配置成本,还需要考虑软件许可成本和日常管理维护成本。
(七)技术支持能力
我们在做存储选型时千万不可忽视存储厂商的技术支持能力这一点。采购和
原创力文档

文档评论(0)