IT168分析:重复数据删除不足之处,产生数据恢复问题

2009-06-07

重复数据删除使磁盘备份更加实际,但它并不是没有完美的。这篇文章将会告诉你重复数据删除的不足和基于磁盘的归档是如何解决这些问题的。

基于磁盘的备份原本是要解决在备份过程中的问题,却产生了它本身的成本和数据恢复问题。基本上,磁盘备份是作为缓存到磁带库上使用的。重复数据删除解决了磁盘备份过程中并不非常重要的转移到磁带的多数恢复问题。磁盘备份本身和重复数据删除都没有完全解决与备份相关的一个大问题,解决备份网络问题。


大多数重复数据删除专用设备是专注于一方面的,或者是数据跨网络已经传输到终端设备上。这就意味着每周就要做一次全备份,大约80%的数据通过备份网络重新传输,然后传送到终端重复数据删除设备内。虽然全备份窗口通常很长,但80%的额外数据仍然给备份窗口造成了压力。多数用户抱怨关于他们的全备份窗口问题,并不能在夜间完成。结果,备份网络架构不得不按每周或每月要求再建。而基于磁盘的归档可以解决网络的挑战以及其他备份过程中的问题,这两种技术是相互互补的。


很多调查显示超过80%的主存储数据是非活动数据。备份设备采用重复数据删除平衡数据以达到最佳化。在这种情况下,20:1的优化率并不常见。这是因为每次用户做一个全备份,大多数数据并没有改变,这对于重复数据删除来说也是合理的。


但是,仅仅依靠重复数据删除技术并不能解决问题,很多备份问题可以通过归档系统和重复数据删除设备得到很好的解决。


在数据中心,人们正在讨论一个关于通过技术实现、更好的资料利用率问题,如服务器虚拟化和自动精简配置。备份网络应用没有什么问题。除了升级备份网络继续满足全备份窗口,另一个应该考虑的就是如何利用现有的架构和资源提高利用率的方法。


当讨论备份网络更好的利用率时,人们看到的第一个技术是边缘重复数据删除技术。这些技术是有优点的,他们确实奠定了本地服务器用户性能负载基础,并在多数情况下要求改变备份软件和应用。


为了实现最大程度的重复数据删除,所有的数据必须使用新的应用。在大多数数据中心,这个是非常简单的,但并不现实。多数用户他们的数据环境特定的配置,虚拟服务器环境,同时也会用其他的应用,如电子邮件归档,与其他备份供应商相比,他们就是来自不同的供应商。


最后,边缘重复数据删除或任何与之相关的备份重复数据删除并不能从根本上解决问题,因为有太多的数据。因此用户创建了更加详细的备份架构,并且需要不断的升级和部署与这些问题相关的新技术。


基于磁盘的归档最终解决了这些问题,减少了主存储数据。把多数非活动数据从主存储上移至二级存储,减少了在备份过程中高达80%的需要保护的数据。


这些数据转移到磁盘级别,特别是对于归档是非常重要的。例如,人们选中NAS与廉价SATA磁盘,是因为节约成本和把非活动数据从主存储上移除掉。这些数据仍然需要管理和保护。事实上,把数据保存在廉价的SATA阵列上,增加了它的脆弱性,因此,也就增加了保护性。


另一方面,基于磁盘的归档系统像Permabit Technologies公司提供的是自我保护,自我恢复和自我升级的。这些非活动数据可以移到这一层,几乎和移到非昂贵的SATA层是一样的,也就是说归档系统也代表有效的节省成本和主存储。


另外,磁盘归档系统是自我保护的。这些系统在RAID 6保护策略之外被移除,它允许多驱动发生错误而不会丢失数据。他们也创建复制,可以很好的把这些系统复制到另一个。由于复制到位,也就没有必要做系统备份。主存储系统有多点冗余,然后被复制到二级系统。二级系统也有那些相同的多点冗余。最终结果是两者结合比用来备份的磁带更加可靠。


由于这些数据安全地存储在磁盘归档上,以及在备份过程中删除归档的需要,全备份数据设置可以成功的减少80%以上。


当实施基于磁盘备份的归档系统时,用户发现他们释放了足够的主存储空间,在今后的两到三年里几乎不用再购买主存储,随着旧的数据移到归档层,他们只需要购买更少的容量的主存储。


同样,归档系统对备份架构也非常有效。全备份现在也减少了80%以上。通过适时的应用基于磁盘的归档系统,未来升级到备份的架构也减少了,因为数据将会从主备份进程中永久的存储到归档系统。


磁盘备份与重复数据删除在企业中是相互作用的。一个中期,大约30天,恢复备份数据,应该恢复使用功能做一次正确的数据副本。这样做的作用是可以延展到一个更长期的策略。


归档系统代表一个新的存储“价值层”,是重复数据删除备份设备的完美补充。他们减少了设备和投资的大小要求。另外,归档系统减少了网络备份架构要求,提供长期数据恢复能力,增加了IT的高效性。