在当今IT管理中,数据存储往往面临容量和性能挑战。总结起来,企业面对的数据存储主要挑战有:
·大量历史数据占用了存储设备空间,严重影响系统性能。
·大量低使用甚至不使用的历史数据占用存储设备,需不断购买新存储设备满足新数据存储需求。
·缺乏对数据生命周期灵活有效的管理。
·不能满足“法规遵从”要求,缺乏长期安全的数据保存。
如何解决这些低使用价值数据的保存问题,是目前企业面临的数据管理问题之一。如果在不影响业务的情况下,将这些低使用价值的文件自动转储到价格低廉的存储介质上,将长时间不被访问的数据归档至磁带库或者虚拟磁带库上,数据的分级存储技术就应运而生。
主流分级存储技术
数据分级存储是指将数据存放到不同级别的存储设备(磁盘阵列、光盘库、磁带库)中,通过分级存储管理软件实现数据在设备之间的自动迁移。数据分级存储技术的理论依据是信息生命周期管理(ILM)理论。新生成的信息会经常被访问,使用价值高,保存到高成本、高性能的存储设备上。随着时间的推移,信息使用价值降低,适合保存到大容量、低成本的存储设备上。主流分级存储架构主要有两级存储和三级存储架构。
在两级存储架构中,主要分为在线存储和离线存储两部分。在线存储就是将数据放在磁盘设备上,支持在线生产业务,离线存储则是指将数据通过磁带来保存。其基本架构如图1所示。

图1两级存储架构
传统二级数据存储采用大容量的磁带作为存储介质。受备份服务器上备份软件控制,数据定时从在线存储备份到离线存储中,保证数据的安全。一方面磁带的大容量特点满足了系统海量存储需求,另一方面离线的数据对能源消耗比较低,可以达到节能减排的目的。但是采用磁带作为二级存储,无法减少备份和恢复窗口,无法满足用户的性能要求。随着数据量的增大,备份到离线存储上的数据无法满足用户的恢复需求,需要不断扩展在线存储容量。这种情况下,三级存储随之出现。
三级存储架构分别由在线存储、近线存储、离线存储组成,其架构如图2所示。

图2 三级存储架构
三级存储与两级存储相比,添加了近线存储设备。近线存储可以充分解决离线存储性能低的问题,大幅减小系统的备份恢复窗口。近线存储多采用低速大容量磁盘设备。备份服务器上的备份软件控制在线存储的数据定期备份到近线存储中,近线存储依据一定策略自动将数据归档到离线存储。当灾难发生后,可以从近线存储中恢复数据。这样,一方面提高了备份恢复速度、减小了备份恢复窗口,另一方面也降低了用户建设成本和运营成本。
编辑:系统管理员