随着计算机技术的发展,很多企业的日常工作也越来越多地与计算机紧密相连。企业的业务、应用等逐步移至线上,在享受计算机带来的高工作效率的同时,还要承受因为计算机的崩溃而造成的数据丢失甚至企业瘫痪的风险。各种相关的数据安全性和重要程度也越来越凸显。在运行过程中大到自然灾害,小到病毒、磁盘故障乃至操作员意外操作失误,都会影响系统的正常运行,甚至造成整个系统完全瘫痪。数据库中的数据是有价值的信息资源,是不允许丢失或损坏的。因此,在维护数据库时,一项重要的任务就是如何保证数据库中的数据不损坏和不丢失,即使是在存放数据库的物理介质损坏的情况下,也应该能够保证这一点。备份数据库就是将数据库中的数据以及保证数据库系统正常运行的有关信息保存起来,以备系统出现问题时恢复数据库时使用。当灾难或系统故障发生后,可通过备份的数据完整、快速、简捷、可靠地恢复原有系统。
随着存储技术的发展,从DAS到SAN、NAS存储架构,备份技术由传统的网络架构备份模式发展到LAN Free 备份、Serverless 备份等全新备份架构技术,如图5-6所示。
所谓LAN Free Backup,顾名思义,就是指释放网络资源的数据备份方式。在SAN架构中,LAN Free 备份的实现机制一般如图 5-7所示。备份服务器向应用服务器发送指令和信息,指挥应用服务器将数据直接从磁盘阵列中备份到磁带库中。在这个过程中,庞大的备份数据流没有流经网络,为网络节约了宝贵的带宽资源。在NAS架构中,情形十分类似,磁带库直接连接在NAS文件服务器上,备份服务器通过一种称为NDMP的协议,指挥NAS文件服务器将数据备份到磁带库中。细心观察之下会发现,这两种方式虽然都节约了网络资源,但却增加了服务器的工作负荷。具体架构如图5-7所示。
Serverless 备份技术的核心就是在SAN的交换层实现数据的复制工作,这样备份数据不仅无需经过网络,而且也不必经过应用服务器的总线,完全保证了网络和应用服务器的高效运行。目前一些厂商推出了自己在这方面的相关产品和解决方案,但是比较成熟且开放性好的产品还在进一步发展中。到目前为止,Serverless 备份技术已经成为所有相关厂商争相追逐的目标,无疑是备份技术领域内最大的热点,相信在不久之后,用户就可以真正享受到这一新技术带来的成果。
除了备份架构的新进展之外,在备份介质选择上,也出现了一些新的趋势。传统上备份介质主要是磁带设备为主,这主要是因为磁带在单位容量的成本上,较之其他介质具有非常大的优势。但是随着技术的发展进步,尤其是ATA技术的发展,硬盘的成本在迅速下降。现在,在一些场合下,磁盘作为备份介质其优势已经越来越明显。一些厂商正在着力劝说用户采用更加方便高效的磁盘代替磁带作为备份介质,更有一些厂商甚至推出了包含磁盘和备份软件的整体设备——备份一体机。
事实上,磁盘作为备份介质的最大好处就是其介质管理工作的简化和性能的提升。前面提到过,一个磁带库的管理工作非常复杂繁琐,如果考虑到对不同厂家的不同型号的磁带库产品,都提供良好支持的话,工作无疑是极其艰巨的。而磁盘介质则几乎不存在这样的问题。这也是备份软件厂商看好磁盘备份的理由之一。
然而,磁带介质本身的技术发展并没有受到这一理念的冲击。相反的,就在磁盘介质向离线存储领域进军的同时,磁带介质也借助数据迁移技术的发展,大踏步地向在线存储领域发展着。
数据迁移技术也称为分层存储管理,是一种将离线存储与在线存储整合的技术。传统上,离线数据是静态的,无法实时的被访问,而数据迁移技术正是冲破这一限制,将离线的数据与在线的数据统一调度,从而实现所有数据的实时访问。与磁盘备份技术相反,这一技术的主要目的就是以一定的存储系统性能为代价,换取大型海量存储系统的总体拥有成本。数据迁移的工作原理比磁盘备份技术略为复杂。简单地说,就是将大量不经常访问的数据存放在磁带库等离线介质上,在磁盘阵列上只保存少量访问频率高的数据。当那些磁带介质上的数据被访问时,系统自动地把这些数据回迁到磁盘阵列中;同样,磁盘阵列中很久未访问的数据被自动迁移到磁带介质上。从某种意义上讲,磁盘阵列以一个磁带库的“中间缓存”的方式被使用,既保证了大多数情况下数据访问的响应性能,也避免了大量利用率低的数据长期占用成本较高的磁盘空间,如图 5-8所示。
不管采用何种架构,备份系统都是由备份硬件设备(如硬盘存储、光存储、磁带存储等)和自动化备份软件组成。本章不再赘述相关硬件知识,重点介绍自动化备份软件相关知识和备份技术。
在任何系统中,软件的功能和作用都是核心所在,备份系统也不例外。磁带设备等硬件,提供了备份系统的基础,而具体的备份策略的制定、备份介质的管理以及一些扩展功能的实现,则都是由备份软件来最终完成的。下面我们就来看看一个备份系统中,软件的作用都包括些什么。
一、Symantec NetBackup软件
NetBackup备份软件是Symantec(赛门铁克)公司提供的企业级备份管理软件,它支持多种操作系统,包括UNIX、Microsoft Windows、OS/2以及Macintosh等。目前,NetBackup是国际上使用最广的备份管理软件之一,最新版本已到7.5。NetBackup软件可以为企业的应用系统实现全面保护、有效存储、随处恢复和集中管理,使企业的应用系统和数据得到有效保护。
NetBackup 7.5版本具有以下特点:
1.异构环境的数据保护
可以在异构操作系统、应用程序、管理程序以及磁盘和磁带架构上实现数据保护功能。
2.集中式管理
可以从一个位置管理所有数据保护技术以及多个NetBackup服务器和域,提高工作效率。
3.源和目标位置的重复数据删除
可以在远程办公室或数据中心按需轻松部署和管理重复数据删除技术。
4.与存储硬件设备的深入集成
NetBackup OpenStorageAPI 可以集中管理重复数据删除和复制技术。
5.虚拟机保护既全面又简单
可以对VMware和Microsoft Hyper-V环境应用获得的备份和恢复技术。
6.快速全面地恢复应用程序和管理程序的数据
可以快速全面恢复 Microsoft Exchange、SharePoint、ActiveDirectory以及 VMware、Hyper-V 等管理程序的文件、电子邮件和其他项目。
7.可伸缩性高。
提供了灵活的三层架构,可以满足当今数据中心不断增长的需求。
8.有效的灾难恢复。
可以通过NetBackup Bare MetalRestore、内置的复制功能和异地磁带管理功能实现全自动的集成式系统恢复。
9.全面的数据保护。
提供了灵活的加密技术,可以最大程度保护传输中的或介质上的数据。
二、NetWorker软件
NetWorker是Legato公司为防止计算机网络数据丢失而开发的一整套跨平台网络数据备份存储管理应用软件。它为企业级网络多平台数据存储管理提供了完整的解决方案。2003年Legato公司被EMC公司并购后成为一个独立软件部门,原EMC主要提供存储硬件产品,并购后进一步扩充了EMC公司的产品线。目前NetWorker最新版本为7.4,全面支持中文管理界面,这在企业级备份软件行业是唯一的,方便中国用户的管理与使用。
NetWorker备份软件提供的是一个完全模块化的解决方案,基于网络而设计的数据保护方案的核心部分,而不仅仅是一个简单的备份软件。目前NetWorker已经融合了从备份到磁盘、再到复制到磁带的各种数据保护功能,统一了备份和恢复,所有功能可在一个通用管理界面下使用,从而降低了成本和复杂性。并将新一代备份功能与Avamar(重复数据消除备份软件)和Data Domain(是一个自动化、基于策略的网络高效型复制软件解决方案,适用于灾难恢复、远程办公室数据保护和多站点磁带整合)的无缝集成,全面优化生产环境中重复数据消除的优势。
EMC NetWorker备份软件的主要特点有:
1.集中化管理
通过 NetWorker管理控制台管理整个基础架构,包括重复数据消除、备份到磁盘、快照、复制和磁带。
2.广泛的数据保护支持
保护从关键业务应用程序到虚拟拓扑结构(包括VMware 和Microsoft HyperV)的整个环境。
3.灵活性、可扩展性和高性能
满足从小型商业环境到大型数据中心的一系列数据保护要求。NetWorker Fast Start是中型客户的理想选择,因为它们需要简化的部署和管理,但不希望牺牲企业能力。
4.领先的重复数据消除支持
在一个框架下融合市场领先的重复数据消除解决方案。在NetWorker工作流程和策略范围内管理Avamar和Data Domain,根据实际使用情形和业务需求获得最大收益。
三、TSM软件
Tivoli Storage Manager(TSM)是IBM Tivoli软件家族中的旗舰产品之一,而Tivoli则是IBM五大软件家族中的一个,其他的四大软件为:Websphere、IM(DB2)、Lotus、Rational。Tivoli软件主要定位于为用户提供企业级管理软件,如系统管理、安全管理和存储管理。TSM能够为用户提供企业级的存储数据管理解决方案,包括备份、归档、空间管理以及灾难恢复管理等功能。
TSM的核心功能是提供集中的数据备份管理,能够为大型的企事业单位提供可靠的集中数据备份管理,是业界最主要的备份软件之一。TSM能够提供稳定先进的架构、强大的备份功能支持和更好的可扩展性。
TSM作为Tivoli软件家族的核心产品之一,拥有非常悠久的历史,可以说是IBM长期以来在存储管理领域不断技术沉淀的结晶。TSM存储管理技术最早可以追溯到1980年,其系统TSM原型是IBM Workstation Data Save Facility(WDSF),由IBM Almaden研究中心研发,主要为了解决当时新出现的分布式系统所面临的数据保护问题。此后IBM基于WDSF在分布系统环境下研发基于备份策略的备份产品,并在1993年7月推出了第一个版本,命名为ADSM(ADSTAR Distributed Storage Manager),也就是TSM的前身。在IBM收购Tivoli软件之后,将ADSM软件划入Tivoli软件家族,并在1999年将新推出的3.7版本正式命名为Tivoli Storage Manager 3.7。2009年4月10日IBM发布TSM6数据管理产品最新版本。
TSM存储管理软件采用了模块化的设计,可以针对不同用户的备份需求采用不同的TSM模块。根据所面向的目标用户规模,TSM软件家族主要分为三个不同的版本:TSM Express Edition、TSM Basic Edition和TSM Extended Edition,分别面向低、中、高端用户。其中TSM Express Editon主要支持Windows环境的数据备份,支持文件、SQL Server、Exchage等数据备份;TSM Basic Edition和TSM Extended Edition则面向中高端用户,能够支持几乎所有主流的操作系统和应用,TSM Extended Edition相比较TSM Basic Edition提供了更多的高级功能和大容量磁带库的支持,所以更加适合于企业级的应用。TSM Extended Edition提供的增强功能包括:支持3个驱动器以上的磁带库,支持灾难恢复功能(DRM模块),支持NDMP备份方式等。
TSM是一个功能非常全面的解决方案,能够提供企业级的存储数据管理功能。从信息生命周期的角度来看,TSM能够提供数据保护、数据归档、分级存储以及数据的销毁等一系列功能。因此,TSM不仅仅是一个数据备份软件,而且能够提供以数据备份为主的更多的数据管理功能,从数据管理功能角度来看,TSM主要有以下功能特点:
1.集中的数据备份与恢复管理
TSM存储管理软件能够为用户提供专业的数据备份功能,能够提供多种级别的数据备份,如文件系统备份、应用系统备份、数据库备份、邮件系统备份、操作系统备份等不同的备份类别。TSM能够支持绝大多数主流操作系统平台、主流的应用,根据用户需求为不同的用户定制合适的备份解决方案。由于目前用户绝大多数的存储数据管理需求主要集中在集中备份方面,所以TSM更多地被认作是一个备份软件。
2.专业的数据归档管理功能
TSM存储管理软件提供专业的文件系统数据归档功能,TSM的数据归档功能构建于TSM基础架构之上,不需要额外安装其他软件模块,也不需要用户单独付费。TSM提供独立的归档策略,能够为不同的数据对象指定不同的归档保存时间,并在归档时可以选择在本地保留文件或从本地删除文件。
3.高效的分级存储功能
TSM存储管理软件能够提供专业的文件系统分级存储功能,能够将磁带等存储设备作为文件系统的二级存储,定制策略将访问较少的文件从服务器的文件系统迁移到TSM所管理的磁带库中,并在本地保留一个存根文件,整个过程可以自动完成,也可以手动迁移。当应用系统或者管理员访问该文件时,TSM能够在后台自动将文件迁移回本地。TSM提供的分级存储功能能够大大扩展硬盘的有效空间。
4.流程化的灾难恢复管理
TSM存储管理软件提供流程化的灾难恢复管理功能,TSM内置一个灾难恢复管理模块(DRM),通过DRM能够对灾难恢复进行规范的流程管理,包括离线磁带的跟踪和回收,能够对磁带状态进行自动设置更新,并能够对整个恢复流程提供所需要的配置信息,恢复脚本,可以指导管理员顺利地完成整个恢复过程。TSM还提供通过网络进行数据传输的容灾方式,能够将一套TSM系统的数据通过专业技术传输到另外一套TSM系统,从而完成基于网络的数据级容灾。
四、备份软件维护技能
(一)备份软件相关概念
1.备份策略
备份策略(Policy)定义一台或几台服务器的备份方法。它包括哪些服务器需要备份、备份哪些目录或文件、在什么时间备份、采用什么方式进行备份等。
2.备份时间表
备份时间表(Schedule)用来定义在什么时间进行备份和归档的操作。它用来定义做全备份,还是增量备份或者用户自己备份、是否归档,备份的频度,备份磁带保留多长时间,可以备份的时间段等。
3.存储单元
存储单元(Storage Unit)指将备份作业按备份设备类型分组,如4mm磁带机、DLT磁带机、LTO磁带机、本地磁盘等。在一种备份服务器上有可能存在多种类型的备份设备。
4.卷
在Media Manager中一盘磁带或一片光盘称为一个卷(Volume)。
5.卷池
卷池(Volume Pool)是磁带或光盘的集合。通过指定卷池,我们可以将磁带按照组分配给用户,使不同类型的作业存放在不同的磁带组中。
6.全备份
全备份(Full Backup)是指将用户设定的整个目录或文件全部备份。
7.增量备份
增量备份(Differential Incremental Backup)是指备份上一次备份以来,更新过的文件或数据。不管上一次备份是全备份、增量备份,还是累积备份。
8.备份保留期限
系统管理员可以指定每次备份可以保留多长时间,即备份保留期限(Retention),当该期限达到时,NBU自动将该备份的相关信息从NBU数据库中删掉(并不从磁带中删掉)。这样,用户就检索不到这次备份的信息。
(二)备份软件维护工作内容
1.设备管理工作
一个单纯的备份设备完成不了备份工作,每种备份设备都有各自的特点和驱动程序,而一般备份设备厂商并不提供设备的驱动程序,对备份设备的管理和控制工作,完全是备份软件的任务。备份软件和备份设备之间存在一个兼容性的问题,这两者之间必须互相支持,备份系统才能得以正常工作。日常维护中要关注设备的可用性,备份驱动器是否有异常和介质是否有异常,如发现异常需及时与硬件维保商联系进行硬件配件的更换。
2.备份数据的管理工作
作为全自动的系统,备份软件必须对备份下来的数据进行统一管理和维护。在简单的情况下,备份软件只需要记住数据存放的位置就可以了,这一般是依靠建立一个索引来完成的。然而随着技术的进步,备份系统的数据保存方式也越来越复杂多变。例如,一些备份软件允许多个文件同时写入一盘磁带,这时备份数据的管理就不再像传统方式下那么简单了,往往需要建立多重索引才能定位数据。
3.备份策略制定工作
我们知道需要备份的数据都存在一个“二/八”原则,即20%的数据被更新的概率是80%。这个原则告诉我们,每次备份都完整地复制所有数据是一种非常不合理的做法。事实上,真实环境中的备份工作往往是基于一次完整备份之后的增量或差量备份。那么完整备份与增量备份和差量备份之间如何组合,才能最有效地实现备份保护,这正是备份策略所关心的问题。还有工作过程控制。根据预先制定的规则和策略,备份工作何时启动,对哪些数据进行备份,以及工作过程中意外情况的处理,这些都是备份软件不可推卸的责任。这其中包括了与数据库应用的配合接口,也包括了一些备份软件自身的特殊功能。例如很多情况下需要对打开的文件进行备份,这就需要备份软件能够在保证数据完整性的情况下,对打开的文件进行操作。另外,由于备份工作一般都是在无人看管的环境下进行,一旦出现意外,正常工作无法继续时,备份软件必须能够具有一定的意外处理能力。
4.数据备份检查工作
系统数据备份人员必须及时做好数据备份和相应记录。IT部门定期对各业务部门数据备份工作进行检查,主要是检查数据备份是否按时完成、记录是否完好无误、备份介质是否按规定保存。重点是检查数据备份和文件备份是否正常备份,以防需要恢复时找不到备份文件和恢复时发现备份文件不可用。
5.数据恢复工作
数据备份的目的是恢复,所以这部分功能自然也是备份软件的重要部分。很多备份软件对数据恢复过程都给出了相当强大的技术支持和保证。一些中低端备份软件支持智能灾难恢复技术,即用户几乎无需干预数据恢复过程,只要利用备份数据介质,就可以迅速自动地恢复数据。而一些高端的备份软件在恢复时,支持多种恢复机制,用户可以灵活地选择恢复程度和恢复方式,极大地方便了用户。