MCPLive > 杂志文章 > 分层存储 企业业流动数据存储解决方案

分层存储 企业业流动数据存储解决方案

2011-08-20向峰《微型计算机》2011年8月上

我们经常听到有企业IT人员在抱怨:花费了大量的时间和精力在企业数据的备份和归档上,降低了自己的工作效率;而当需要用到这些数据的时候,反向操作也要花费大量的时间。与此同时,随着企业数据的快速增加,花费在数据存储上的成本也在飙升。这样的问题应该如何解决呢?

进入信息化时代之后,数据对于一个成熟企业来说开始变得越来越重要,信息生命周期管理(Information Lifecycle Management,ILM)的概念迅速被企业所接受。在信息生命周期管理模型当中,信息拥有从产生、保存、读取、更改、迁移、存档、回收到再次激活以及退出的完整生命周期。而企业之所以要进行信息生命周期管理,主要是为了在信息生命周期的各个阶段以低的成本获得大的价值。我们知道,信息数据存在的基础是存储系统,这也是信息生命周期管理的对象和关键。为了在数据生命周期管理中实现高效率和低成本,企业需要调整存储系统结构、改善数据管理方式。为了达到这种目的,“分层存储”的概念被提了出来。

我们正处在数据爆炸性增长的时代
我们正处在数据爆炸性增长的时代

分层存储 降低成本

分层存储(Tiered Storage)的操作方式是为不同类型的数据分配不同类别的存储介质,以实现提高存储效率、减少总体拥有成本的目标。其中,存储介质类别的选择取决于某项应用对服务级别的需求(如可用性、响应速度、存储需求、使用频率等)。相关调查数据表明,企业日渐庞大的数据(很大一部分是由企业内部邮件服务器产生的)当中,在30天到90天后大约有70%至80%的数据将成为非活动数据,这些数据很少被访问,但是依然需要保持在线状态,以满足极少的访问需求。显然,将这些非活动数据与被频繁访问、需要更高响应速度的活动数据(如企业内部相关数据库)一起放在高速存储介质上是一种浪费,这将导致昂贵的高速存储器的规模变得非常庞大且难以维护。

企业数据中存在着大量的非活动数据

分层存储的实施,迫切的原因在于存储成本的急剧增加。目前企业存储介质主要有SSD固态磁盘、FC磁盘、SAS磁盘以及SATA磁盘几种,同一种磁盘也有不同的速度规格(主要有15000r/min、10000r/min、7200r/min三种)。不同磁盘类别之间的价格差异非常巨大,通过将某些数据转存到较低级别的磁盘上,可以降低50%甚至更多的存储成本。当然,分层存储的实现方式并不是像我们想象的那样,只是在两三块不同规格的磁盘之间拷贝数据,而是将数据存储在由不同规格的磁盘以及不同RAID模式(0、5、6、10等)的阵列进行虚拟化得来的不同层级的存储池中。在以往,分层存储需要使用不同的存储设备共同实现,但是这种模式存在效率低、可靠性差、实施难度大等问题,因此目前普遍的分层存储方案均依托集成多种存储介质的一体化存储中心实现。

分层存储的前提是采用不同类别的存储介质
分层存储的前提是采用不同类别的存储介质

自动调度 提高效率

对于企业IT人员来说,通过手动完成数据的分层存储是一个漫长而费神的过程。从清点数据、确定数据优先级、安装设置分类软件、根据数据优先级进行分类到手动迁移数据,整个过程可能要花费一两个月的时间,并且随着数据的变化这样的过程还需要重复进行。

自动分层存储(Automated TieredStorage,ATS)的优势在于效率更高、无需停机就可进行在线数据迁移。自动分层存储管理系统具备在存储层之间动态迁移数据块的能力,IT人员通过自动管理软件(如戴尔Compellent的数据调度程序(Data Progression))设置规则,然后根据这些规则对含有不同信息的数据块进行分层存储。这里所谓的数据块,是根据数据的性质进行重新划分的数据元素,每个数据块中都有一个元数据用于记录该数据块创建、修改、访问频率等相关信息。自动管理软件在对数据块进行迁移时,就是根据其元数据的相关信息与已有规则进行对比,然后判断该数据块适合的存储层。这些数据块的元数据是变化且受到监控的,自动管理软件会自动检测并把长期闲置的数据块迁移到低性能的存储层,把活跃数据放在高性能的存储层中。

数据将被分别存储在不同类型、不同模式的存储层中
数据将被分别存储在不同类型、不同模式的存储层中

实际使用中,数据首先被写入到高性能固态磁盘(SSD)或者光纤磁盘(FC)组成的Tier1存储层中。在某些数据的访问频率下降后,这些数据将被自动迁移至光纤磁盘(FC)或者SAS磁盘组成的Tier2存储层中。而在一段时间后,长期处于非活动状态的数据将再次被迁移至高容量SAS磁盘甚至SATA磁盘组成的Tier3存储层中。此外,为了进一步针对关键应用释放充足的高性能存储空间,系统快照也将被自动迁移到高容量低成本的存储层上。自动分层存储系统通过虚拟化存储中心与自动管理软件的结合,实现了对数据的智能管理,这种流动数据(Fluid Data)架构提升了数据管理效率。

数据块的元数据记录的诸多信息是自动分层存储的判断依据
数据块的元数据记录的诸多信息是自动分层存储的判断依据

写在后

随着企业数据的保障性增长,存储系统的成本逐渐变成了企业IT系统中占据的比重也越来越大。基于自动分层存储系统的流动数据架构,改变了传统的存储、归档、备份等数据操作,让信息生命周期管理变得更加高效和低成本。通过一套智能的数据追踪、分类、迁移软件和模块化、虚拟化的硬件,企业可以将存储成本降低50%至80%。同时,基于虚拟化技术的存储系统,在扩展性和升级性方面拥有更高的实用性,避免了因为加入新的存储资源而造成了系统停机和可用性降低。更重要的是,这套系统可以将企业IT人员的精力从繁琐的执行层面解放出来,用于企业整体IT架构的改进和调整,以实现更高的效率和可用性。

分享到:

用户评论

用户名:

密码: