[灾备] 数据副本管理技术(CDM)

运维少年 运维少年

CDM数据保护的问题


现在的 IT 环境中,数据保护系统是必不可少的一套系统,数据保护一般通过备份软件来实现数据的自动化备份、数据保存周期管理以及需要时进行数据恢复。数据保护最主要的的目的,就是当生产数据出现问题时,能够进行恢复。然而,现今数据量越来越大,业务越来越互联网化,系统出问题时,如果要从备份里去恢复,要花费很长时间,造成业务中断很长时间。所以,但长期以来,备份软件只是“备份软件”了,很少把它称为“备份恢复软件”,在很多用户已建立的数据保护环境中,是否能恢复数据,只有在数据丢失时那一刻才真正了解,这对很多用户来说其实是无奈之举。
备份系统使用的存储介质已经从磁带慢慢变成了磁盘,这对数据恢复已经有了一定的提高。但随着业务系统数据量的不断增大,备份的时间仍然越来越长,从备份里恢复仍然太慢,备份软件在用户的日常恢复工作中的作用越来越小,恢复时带来的麻烦越来越大。所以,很多备份软件厂商称备份系统是“最后一道防线”。如果备份恢复的技术如果没有革命性突破的话,以后,这类软件只能称为归档软件了,在 IT 系统中的作用会越来越小。

CDM数据副本的问题


进入互联网时代企业应用爆发式增长,多个不同的应用(查询、测试、审计、应急等)会使用同一份数据(客户信息、交易信息等),据 IDC 统计,副本数据消耗了企业60%的存储容量、和 65%的存储软件采购费用。另外企业的应用环境越来越多地分布于混合环境(数据中心、私有云、公有云、分支机构),数据在多个应用之间和混合环境之间如何做到敏捷流动(数据管理和数据服务),如何降低数据存储和流动的成本,成为 CIO 关注的主要问题之一。

CDM带来的效益


CDM 可以取得如下收益:

  1. 获取数据更快捷。以永久增量、全量合成方式获取变化中的数据拷贝,拷贝过程对数据源的影响降到最小并确保一致性。
  2. 使用数据更方便。CDM 可以快速生成多份数据,以不同的逻辑版本形式分别提供给多个不同的应用,直接挂载,无须进行数据副本的恢复。
  3. 管理数据更高效。使用 CDM 之前,企业需要为每个应用准备数据而去做点到点的复制和拷贝;使用 CDM 之后,企业通过一个 CDM 平台获取数据,把数据虚拟成多份同时向多个应用提供数据服务。把复杂而分散的获取数据、准备存储、挂载数据、保护数据等过程统一到 CDM 平台上自动化实现,变 IT 基础设施为DaaS——数据即服务。
  4. 存储数据更精简。CDM 的数据虚拟化服务是以一份物理数据虚拟出多份逻辑数据提供服务,因此大大精简了存储空间。为企业节省了大量用于“二级数据存储”的硬件投资。
  5. 数据流转更智能。CDM 的数据服务集成了数据脱敏、数据格式转换(ETL)、云交互(Cloud-out)等技术,支持开发测试、大数据分析等应用场景以及混合云环境下的数据流通。

CDM数据保护场景


传统数据保护技术,实现 OS、数据库、备份。因为以前磁带库的容量价格比高,所以提供对磁带库的管理是重要的技术之一,例如磁带标签、自动更换磁带等。随着磁盘的容量价格比越来越高,也开始支持磁盘介质作为备份目标,但备份数据格式仍是磁带格式,例如 tar、cpio 等。
CDM 可以抛开传统的磁带概念,充分利用磁盘数据格式,加入了更多功能,因此大大扩展了备份的概念。
以 Oracle 备份为例,一般 CDM 的步骤如下:

  1. 挂载备份存储为临时盘给到数据库服务器
  2. 通过数据库 API(RMAN for Oralce)生成数据副本
  3. 复制及合成增量数据块
  4. 数据库服务器卸载临时盘
  5. CDM 软件内部产生快照,保留该时间点的全量数据副本值得一提的是,CDM 备份数据库时,通过数据库认证的接口进行,完全保证了备份数据的一致性,这与传统的 CDP 备份技术有很大区别。

CDM 在数据保护方面还有另外一个重大优势,即合成全备份功能。备份的数据量越小,备份速度越快,对带宽占用、对业务影响就越小。所以应该尽量多做增量备份,减少全备份。
然而,矛盾的是,恢复时,全备份的恢复速度远远大于增量备份的恢复速度,因以采用传统备份手段时,一定要定期做全备份,以保证恢复速度。增量备份数据合成为全备份数据的功能解决了这个矛盾,第一次备份后,以后可以永远增量备份,然后由合成一份新的全量数据进行保存,以后备份窗口只跟每天的增量数据有关,和全量数据无关。因此无论从备份窗口还是备份存储的数据量,CDM 都有很大优势。

CDM数据恢复场景


如果从备份介质恢复到业务磁盘,数据量越大,恢复时间越长。传统备份方案技术中,备份的数据需要恢复才能使用,恢复时间取决数据量、带宽等因素,需准备恢复空间。
现在业务数据量越来越大,用户经常遇到几个 TB 的数据库恢复时间以天计,甚至超过一周,大大影响了业务数据的 RTO 以及进行恢复演练的可行性。
大部分 CDM 支持备份数据直接提供给业务机器使用的功能,在应急情况下,无需准备空间及恢复数据,将备份介质直接挂载给业务服务器,几分钟就可以实现恢复,无论是3TB,10TB,还是 20TB 的数据库。因为它再也不需要从备份里将数据导回到需恢复的系统,恢复时间与数据量大小无关。
因此,CDM 在大数据量的数据库、虚拟化等环境中,从备份效率和恢复效率来看都有着很大的优势,对备份系统是革命性技术变革。

©著作权归作者所有:来自51CTO博客作者mb5ffd6f0f39006的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. [灾备]通过 NAS 与文件服务器结合构建数据容灾系统
  2. 安全星球企业云盘:释放数据价值,推动企业数字化转型
  3. 强势崛起|大数据BI行业的黑马选手——Smartbi
  4. 数据分析必备5个EXCEL技巧,数据再多也不怕
  5. 像Excel一样使用SQL进行数据分析
  6. MySQL GUI工具,助力数据库管理
  7. 想找好用的BI软件?看这一篇就够了:2021年好用的BI软件推荐
  8. 2021年哪些办公软件比较好用?
  9. Spark2.x精通:BlockManager原理剖析

随机推荐

  1. Android系统启动流程(4) —— 解析Launch
  2. Android Studio --- > [学习笔记]Button
  3. 自定义android开机动画
  4. Android源代码目录组成介绍-android学习
  5. android 控件-TextView用法整理
  6. Android(安卓)Studio debug.keystore位置
  7. 【Android布局】在程序中设置android:gra
  8. [转]Jollen 的Android 教學,#1: Android
  9. 【Android】EditText标签调用键盘
  10. Android GUI Padding和斜体字的问题