有了以上我们列出的所有项目,下面让我们看一看主存储数据缩减的一些执行方法:
·基于存储系统的执行方法
一般主存储提供商会采用这种方法,而且这种方法通常会导致数据的蔓延。此外,还有一些以inline实时数据缩减为特性的产品。这些方法中有一些仅仅是局限在卷层级上进行数据对比,或者大多是在一个阵列内对多个卷进行对比。因为可对比的样例是有限的,所以能够被发现的数据冗余也是有限的(当尝试重复数据删除时,数据范围越广,提高存储效率的可能性越高)。NetApp在今年年初推出的重复数据删除解决方案采用的就是这种方法。
·inline压缩方法
一般独立存储供应商会采用这种方法。这种方法存在一种挑战,如果每个磁盘的I/O处理都使用一个数据缩减产品,这种产品就需要对所有数据文件进行压缩,这会导致延迟的问题。而且,如果一个系统是线内运行,那么这种技术就无法识别出经过预压缩处理的数据,并进一步找到适合这些数据的优化方法。如果一个系统将预压缩数据忽略掉的话,那么也就意味着它可能会忽略掉那些容量最大、增长速度最快的数据组。初创厂商Storwize采用的是这种方法。
·混合模式优化
第三方也可以提供这种混合模式优化。在一个混合模式系统中,带外系统检测应用可以找出适合缩减的数据,它可以找到某种特定的数据类型,并且为其选择合适的数据缩减方式。这种解决方案还可以收集来自多个卷和多个存储系统的数据组,即使这些存储系统是来自不同制造商的。一个混合模式系统能够采用基于跨模式的不同数据缩减技术,这使得对陈旧文件的处理效率大大提高了。
一个混合模式系统还具备一个带内读取程序,所以当用户需要读取某个文件的时候,如果这个文件是来自压缩数据组的话就不会遇到读取延迟的情况。
如果将来自光纤通道磁盘的50TB数据迁移到50TB的SATA磁盘上很有趣,那么将这50TB的数据从光纤通道驱动器迁移到10TB的SATA设备中就是不可避免的。初创厂商Ocarina的解决方案采用的就是这种方法。
结论:一项具有很高投资回报率的重复数据删除技术需要配置于多存储系统平台之间,处理数据之间的微小差异而不会对系统环境造成影响。随着这项技术逐渐发展起来,混合模式优化方法将成为最能满足目标的方法。
用户评论