应对数据中心断电 和力记易有良策

16.06.2016  22:14

    端午假期还未结束,据大连晚报报道,6月10日,大连电信枢纽楼机房因市电故障,设备突然闪断,并造成部分线路短路,变压器受损引起跳闸,因此导致核心设备出现故障。此种情况造成大连市区、旅顺地区移动网用户手机通话、短信等功能无法正常使用(但4G用户的数据业务正常),同时,导致大连市区、旅顺地区的部分固定电话和宽带业务中断。本月初,据雨果网报道,因澳大利亚东海岸的暴风雨,导致周日(6月5日)早上亚马逊的AWS数据中心的一些服务器断电,澳大利亚多个网站因此瘫痪,消费者无法使用这些网站的服务。

    意外断电是数据中心或者机房发生率最高的意外事件,据不完全统计,仅在国内每年因为断电故障而导致的数据丢失、数据错误或者业务中断的信息事故几乎每周都在上演。为了防止数据中心或者机房意外断电,增加多组UPS储电电源是最基础的应对措施。今年四月,江西省宜春市第二人民医院信息中心机房因UPS电池爆炸而导致所有服务器暂停运行,后经和力记易工程师协助第一时间完整恢复了HIS系统数据,虽然医院业务停顿了数天,却没有丢失一条有用数据。显然,UPS电源也并不靠谱。要从根本上避免造成不可挽回的损失和业务停顿,如何保障数据安全和业务连续是有待解决的重点问题。

    如何保障数据安全?——数据备份

    上面我们也提到过,从硬件层面而言,电源备用设备可以在一定程度上避免意外断电的发生,IT部门也会部署应急预案,尽其所能的保护机房设备、保护数据、保障人员安全,除此之外,部署数据备份软件保障数据安全则是必不可少的。是否所有数据备份软件都能在机房意外断电的情况下对服务器数据起到保护作用呢?

    调查显示,定时备份软件只能按照设定时间对数据进行备份,会丢失大量未备份的数据;实时备份软件能够备份灾难发生前的全部数据,但是部分软件在恢复数据时会出现恢复数据不完整或恢复数据不可用的情况;CDP实时备份软件(备特佳)则不仅能够保证实时备份全部数据,最重要的是在数据恢复时,可以按任意操作步数或时间点进行数据快速回退,恢复到任意时间点,且保证恢复数据的完整可用性,这也是CDP产品优于其他软件产品的关键所在。

    如何保障业务连续?——异地容灾

    保障数据安全是保障业务连续的基础,有了完整可用的数据才能谈得上保障业务的连续性。随着信息化的不断发展和深入,数据备份在很大程度上已经不能满足企事业单位日益增强的容灾要求了,异地容灾成为必然趋势。异地容灾通过在两个不同的地方构建一套或者多套相同的应用或者数据库,进一步提高了数据抵抗各种可能安全因素的容灾能力。一旦发生数据中心断电的情况,灾备中心的备份服务器能够接管数据中心的生产服务器,从而保障业务不受影响。

    市场上能够实现业务接管的容灾备份产品也不少,从接管方式而言,有手动接管的也有自动接管的,手动接管在接管过程中需要人工干预,运维人员的专业水平和技术能力会在一定程度影响业务中断的时间长短;手动接管能够实现生产机宕机的整机接管,最短在60秒内恢复生产机的正常运行。还有个别产品以卷挂载方式进行业务接管,严格来说这算不上是手动接管,因为卷挂载也需要人工运维。

    良策在此 拿走不谢——CDP容灾备份产品与方案

    保障数据安全与业务的连续性需要根据实际业务需求出发选择行之有效的数据备份产品,部署数据级或者应用级异地容灾方案,选择“召之即来、来而能战、战之即胜”的供应商。在此,小编要负责任的说一句,市场上冒牌的CDP产品很多,凡是基于复制、镜像、快照或者镜像+快照技术的产品,凡是号称可以恢复到分钟或者秒级数据的产品,都不是真正的CDP产品哦。还不懂的可以详细了解下CDP(持续数据保护)的定义。其实从字面上也很好理解,C是Countinous(持续),不是minute(分钟),更不是second(秒),不然CDP早改名叫MDP或者SDP了。

编辑:闫志阳