自由和高质量:预售如何为项目定下基调

通常,团队的骄傲是执行。制定解决方案的最重要工作被不公正地掩盖了。在我们的银行后备系统现代化项目中,冰山的这个隐藏部分比项目本身更耗费人力。并没有白费。深入研究有助于为实际业务问题找到平衡的解决方案,并证明选择昂贵但更合适的产品-Dell EMC Data Domain 6800是合理的。





银行的备份系统(DBS)长期以来一直在Veritas NetBackup软件的基础上运行。但是,SRC正在旋转的设备无法再承受负荷。



即将出现问题的信号是缺少备份窗口。 SRK不再有时间在一夜之间从服务器和工作站备份数据,并且一些任务分散在整个工作时间。结果,对于某些资源而言,并非每天都进行复制,因此,如果出现实际故障,则存在数据丢失和违反SLA级别的风险。



另一个问题是磁盘库空间不足。为了以某种方式弥补这一点,客户将磁盘库上备份的存储时间从14天减少到7天。这给磁带库驱动器带来了额外的压力,而磁带库驱动器几乎被完全利用了。



磁盘库用于在线备份存储,并提供并行执行的备份作业,最多同时执行25个线程。



磁带库用于长期存储。根据监管机构的要求,各种文件必须保存1至5年。随着负载的进一步增加,客户将难以遵守中央银行的规定。前景不是很乐观。



更改?修理?扩大?升级?



当SRK开始“窒息”,接近其生产力极限时,客户提出了一个问题-系统的“瓶颈”在哪里?由于我们参与了SRK的软件部分的维护,因此该银行的IT服务要求我们分析系统的运行情况。



当时的解决方案包括以下组件:



  • 1个NetBackup Solaris x86主服务器/介质服务器
  • 1个VMware Backup Media Server;
  • 45 x AIX媒体服务器
  • 10台SPARC Solaris媒体服务器;
  • 1个处于VTL模式的Dell EMC Data Domain 4200磁盘库;
  • 1个带有8个LTO6驱动器的Oracle SL3000磁带库。


为了存储在线备份,使用FC协议将来自媒体服务器和企业客户端的多个备份流同时记录到磁盘库中。然后,将副本通过FC协议通过NetBackup主服务器/介质服务器备份到Oracle SL3000库的磁带介质中。



该银行拥有830个SRK客户端,其中包括大约730个VMware虚拟机,AIX和Solaris上的企业客户端以及物理x86服务器。备份的数据完整副本的原始容量为115 TB。



为了找到瓶颈,我们查看了NetBackup作业执行统计信息,介质服务器I / O配置,SAN配置,磁带库驱动器利用率和磁盘库性能。为此,客户向我们提供了诊断报告:



  • nbsu-Veritas NetBackup支持实用程序;
  • NetBackup DeployUtil和软件许可证规范;
  • Brocade SAN Health在SAN配置上;
  • 来自Data Domain磁盘库的自动支持。


nbsu报告-Veritas NetBackup支持实用程序提供有关NetBackup配置的全面信息,包括备份作业的性能详细信息。此信息显示在bpdbjobs转储-most_columns中。但是您需要能够对其进行解析,并将日期和时间从纪元格式转换为人类可读的格式。





bpdbjobs命令的输出可帮助您评估每个作业的性能和持续时间。这是在时间范围内获取磁带库驱动器处置情况的方式





nbsu包含有关使用的介质,保留期及其在池中的分布的数据。以下是基于nbsu的NBU_available_media.txt的介质保留时间的摘要。





NetBackup DeployUtil报告估计了不同许可模式(传统许可和容量许可)的备份软件许可的实际消耗。它是在MS Excel中生成的,包含备份客户端的完整列表,有关冗余服务器的平台,所使用的NetBackup版本以及要备份的数据量的信息。



Brocade SAN运行状况报告介绍了SAN拓扑,分区配置,以及ISL链接的利用率。



Data Domain AutoSupport“谈论”磁盘库配置,存储效率和性能。解析之后,我们确定了模式并获得了负载的热图:





结果,原来的“弱链接”是在VTL模式下工作的Dell EMC Data Domain 4200磁盘库。



我们比较了备份量及其频率的实际参数和形式要求。事实证明,磁盘库的当前容量和性能无法在所需的期限内提供操作CD的存储。而且,正是由于Dell EMC DD4200读取速度的限制,磁带上的信息复制以接近极限的方式发生。 DD的读取性能较低是由于信息重新水化的资源密集型过程-在重复数据删除之前将块序列恢复为其原始形式。



一切都表明需要替换过时的磁盘库。客户需要可以每小时支持5-6 TB数据的硬件,以及用于容错和增加容量的附加控制器。



三个候选人可供选择



在这种情况下,最明显的建议是用较新的版本替换Dell EMC Data Domain。或者可以使用Veritas NetBackup Appliance替代。 (这在很大程度上与Data Domain类似,并且价格相同)。但是,这两种选择都引起了预算问题。



第三种选择是基于标准架构服务器的解决方案,该服务器具有本机重复数据删除Veritas NetBackup-介质服务器重复数据删除池(MSDP)。



当我们向客户提出建议时,事实证明他已经考虑过其他供应商提供的基于Veritas NetBackup Appliance和Dell EMC Data Domain的解决方案,但客户不确定价格/结果比率方面的最优程度。换句话说,我们在标准服务器上的版本派上了用场。



在银行测试基于Veritas NetBackup Appliance的配置时,我们向客户的IT团队提供有关使用Veritas的重复数据删除的细节,光纤传输技术通过SAN传输SRK流量的细微差别,基于NetBackup Accelerator技术创建综合副本的机制的建议,并建议对这些技术进行验证进入测试程序。根据测试结果,客户批准了我们的解决方案,该解决方案基于两台带有块存储的标准x86服务器,因为其中已实施了整个测试技术堆栈。



我们还准备了一个建议,用一个更新的库替换Dell EMC Data Domain 4200。在此项目中,选择了Dell EMC Data Domain 6800 HA模型-一种更强大,更宽敞和更具生产力的模型。该解决方案的优点是在双控制器配置中该库的高可用性。此配置中的磁盘库不再是单点故障。如果控制器丢失,则该库将通过NPIV技术保持可用,并且备份作业将自动继续。



在选择基于Data Domain的解决方案的情况下,客户无需用SAN客户端替换SRK Enterprise客户端的客户端软件,并且将其“嵌入”到IT领域的工作量很小。这是Dell EMC Data Domain 6800 HA的另一个优点。



更多功率+ DD BOOST



Dell EMC Data Domain 6800磁盘库支持双控制器模式(高可用性),不仅可以与VTL协议一起使用,而且还可以与DD BOOST一起使用。新磁带库的可用容量为174 TB(不包括重复数据删除和压缩),而Dell EMC DD4200限于130 TB。此外,我们估算了磁盘库的预期速度,并向客户展示了应在每小时5.3到8 TB的速度下同时进行读写操作,完全满足了他备份和将数据传输到磁带的需求。



事实证明,对DD Boost和VTL的同时支持非常有用,因为在出​​现兼容性问题时可以组合使用多种技术。 DD Boost的优势显而易见:



  • ;
  • ( ) (image);
  • DD Boost , - NetBackup;
  • NetBackup ;
  • .


由于银行的生态系统基于VMware虚拟化,因此NetBackup Accelerator for Vmware也是DD Boost的有用功能。该技术可跟踪已更改的VMware CBT块(已更改块跟踪),并基于重复数据删除技术在增量备份期间创建合成的完整备份。同时,保留了从虚拟机备份中粒度恢复文件和Microsoft应用程序(AD,SQL,Exchange,SharePoint)的可能性。



更实惠,但更好



我们的团队已计算出切换到新库的各种选项的成本。事实证明,使用标准服务器重组SRC将需要更多的集成工作。但是,最不愉快的是给企业带来了额外的风险:更换客户端备份软件,重新配置策略,结果是最关键的服务器(超过50台AIX / Solaris服务器)可能停机。



结果,客户选择了迁移到Dell EMC Data Domain 6800。



Dell EMC Data Domain 6800是更昂贵的选择。但是,通过使用它,可以总体上降低现代化的成本:不更改RMS的基础结构,最大程度地降低数据丢失和服务不可用的风险,并且不放弃旧的磁带库。因此,向系统中添加另一个DD会使存储容量增加一倍以上,而在已经调试的过程中就没什么了。维护VTL支持不需要在NetBackup介质服务器和企业客户端上进行其他配置。也无需更改客户端备份软件,并且可以在磁盘库之间轻松地重新分配备份作业-已安装的DD4200和新的DD6800。用于将备份转移到磁带的SLP策略也保持不变,现在只有数据来自两个磁盘库。



过渡到新系统



以下是目标解决方案:





在引入新磁盘库时,扩展备份容量的需求已迫在眉睫,以至于银行准备将生产备份到该磁盘,直到所有测试完成。我们设法劝阻客户不要执行此步骤。我们已经对测试程序进行了所有检查,包括破坏性的故障转移测试。



实施很快。两周后,银行正在运行一个新的磁盘库。结果,在接下来的几年中,客户收到了具有更大容量和足够性能余量的系统。实际上,绩效指标甚至超过了计算得出的指标。DD 6800的实际性能为每小时8-9 TB(从5.3 TB计算),考虑到重复数据删除和压缩,其容量约为1 PB。



因为我们只是扩展了磁盘存储容量而没有改变架构,所以该银行的NetBackup许可证成本保持不变-在数据备份和客户端数量方面没有任何变化。现在,新磁带库可与Dell EMC DD 4200并行运行,但是如果需要,它的容量足以轻松停用旧磁带库。



在项目开始时,对劳动力成本的深入研究“超过”了新图书馆的引入。实际上,我们完成了一个小型咨询项目,错误地估计了0卢布的可能选项。但事实证明,它并没有白费。这使客户可以获得现代化的理由,最大程度地降低风险并做出明智的决定。



作者:Alex Info Polyakov,Jet Infosystems数据存储系统设计工程师



All Articles