备份的等级以及改善备份的解决方案
备份等级:
容灾备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。根据容灾系统对灾难的抵抗程度,可分为数据容灾和应用容灾。数据容灾是指建立一个异地的数据系统,该系统是对本地系统关键应用数据实时复制。当出现灾难时,可由异地系统迅速接替本地系统而保证业务的连续性。应用容灾比数据容灾层次更高,即在异地建立一套完整的、与本地数据系统相当的备份应用系统(可以同本地应用系统互为备份,也可与本地应用系统共同工作)。
在灾难出现后,远程应用系统迅速接管或承担本地应用系统的业务运行,设计一个容灾备份系统,需要考虑多方面的因素,如备份/恢复数据量大小、应用数据中心和备援数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等,根据这些因素和不同的应用场合,通常可将容灾备份分为四个等级。
第0级:没有备援中心
这 容灾备份,实际上没有灾难恢复能力,它只在本地进行数据备份,并且被备份的数据只在本地保存,没有送往异地。
第1级:本地磁带备份,异地保存
在本地将关键数据备份,然后送到异地保存。灾难发生后,按预定数据恢复程序恢复系统和数据。这种方案成本低、易于配置。但当数据量增大时,存在存储介质难管理的问题,并且当灾难发生时存在大量数据难以及时恢复的问题。为了解决此问题,灾难发生时,先恢复关键数据,后恢复非关键数据。
第2级:热备份站点备份
在异地建立一个热备份点,通过网络进行数据备份。也就是通过网络以同步或异步方式,把主站点的数据备份到备份站点,备份站点一般只备份数据,不承担业务。当出现灾难时,备份站点接替主站点的业务,从而维护业务运行的连续性。
第3级:活动备援中心
在相隔较远的地方分别建立两个数据中心,它们都处于工作状态,并进行相互数据备份。当某个数据中心发生灾难时,另一个数据中心接替其工作任务。这种级别的备份根据实际要求和投入资金的多少,又可分为两种:
(1)两个数据中心之间只限于关键数据的相互备份;
(2)两个数据中心之间互为镜像,即零数据丢失等。零数据丢失是目前要求 高的一种容灾备份方式,它要求不管什么灾难发生,系统都能保证数据的安全。所以,它需要配置复杂的管理软件和专用的硬件设备,需要投资相对而言是 大的,但恢复速度也是 快的。
改善备份性能的五大要点
要点1:监控程序
在备份过程中,监控本身并不会导致发生故障运行失败,但其确实可以使得当某一个故障失败发生时更难以被发现。随着IT世界的范畴变得越来越广阔,备份系统必须进行改变,以查看和管理多个备份服务器。现在,大多数系统并不是设计用于同时监控多台服务器的,而如果一个问题出现,整个拆解过程会变得相当繁琐和困难。
解决方案:
我们所需要的是一款具有自动化功能的监控系统,该系统将能够汇编数据,并以图形方式提供用户界面,提供对于整个环境的一个全面的视图。同时对于个别服务器和客户端也应该是可视化的。为了进一步简化操作,该系统还必须能够监控在某一特定的业务中使用多供应商的备份。
要点2:不要错过通知警报
虽然对于一般性的沟通问题而言,将电子邮件通知警报发送到适当的管理员通常是一个可靠的方式,但情况并不总是保持不变的。随着时间的推移,服务器,应用程序,备份设备和人员安置情况总是在变化的,因此,经常核实并确保警报能够在 时间通知到恰当的工作人员来进行处理是非常有必要的。
解决方案:
实时警报是一款很好的解决方案。这种类型的警告可通过电子邮件、SNMP集成整合和SMS短信将警报发送给不同的人员, 定位适当的人员来接收信息,并快速、高效地进行沟通。
要点3:注意命令行操作系统错误
虽然管理员可能更倾向于采用命令行界面来完成一项工作,但这很容易出错!原因是由于在使用该方法时,不同管理者之间的备份缺乏一致性。 佳的做法应该是通过及时更新来加强编纂,但这种情况并不经常发生,致使错误发生屡见不鲜。
解决方案:
一款用户界面允许GUI操作的备份功能必须添加到IT部门的备份系统。这样就减少了人为错误的机会,提高了当前操作的可重复性。
要点4:对于报告和规划重视不足
由于企业的备份专业人员能够将主要精力集中在系统所发送的警报报告方面,但务必要记住的是,这些信息只提供了管理备份环境中的难题的一部分。很多时候,备份管理人员会错过某些特定部门和程序所发来的许多其他重要的报告。
当备份服务器开始托管传输的警报和监视数据时,问题很快就会随之而来。一般情况下,主备份服务器上的数据只保存很短的时间,可能导致其不能够再被访问,从而使得理解和防止下一次故障失败的任务变得几乎不可能。
解决方案:
遵循我所推荐的 佳实践方案,谨慎的做法是从初级的和分布式备份服务器编译数据到单个数据库,这将有助于保持日常数据备份的平稳运行。通过这种方式,可以进行数据分析,并在您的部门根据具体需求采用各种报告。
要点5:配置错误
虽然IT部门非常精通备份和恢复系统,但有时也可能出错。配置错误便是一个例子;这种情况经常发生,因为数据和服务器环境被扩大。下面是一些常见的问题:
恢复日志的规模大小不准确:这样的恢复日志可能会导致信息丢失。这种特殊的领域,必须手动扩大并重新启动,以避免灾难的发生。
从磁盘到磁带不匹配:当使用小的磁盘池时,可能存在新的数据不被接受、推迟备份、并导致错过了备份窗口的机会。只有一个线程可以从一个磁盘池写入到磁带设备,并且如果磁带不能处理数据必须从磁盘被写入的速度,磁盘池将不能够备份数据。
同时备份的过载:备份系统的 大客户端数很容易被超过,更不要说错过了备份窗口。这个问题可能会在数据环境增长和添加备份客户端时发生。
解决方案:
不管错误情况时怎样的,许多IT专业人士使用的都是更大型的监控系统,其提供了更全面的看法。这种更全面的视图提供了对于发现错误更直接的方法,并有助于在一个不断变化的环境中确定造成的因素。备份软件和监控系统被一起使用,以便IT部门可以准确评估备份环境的需求。