资讯专栏INFORMATION COLUMN

谨防云中断,数据中心冗余如何设计?

jayzou / 2571人阅读

摘要:云计算提供商提供的云服务在出现中断时,行业厂商和用户似乎都在学习如何设计本地云冗余,管理人员希望将这些教训应用于传统的虚拟化数据中心冗余。云计算冗余并不完美,停机中断提供了经验教训高度冗余的系统不会免受性能下降的影响。

很多公共云提供商在日常运营中通常不可避免地遭遇灾难性中断,而IT管理人员需要从云平台的故障和教训中学习,并将其应用到内部基础设施当中。

云平台(尤其是大型公共云平台)具有多种冗余级别,但没有一个平台能够抵御出现的意外停机。云计算平台和数据中心一样,都会遇到导致停机的问题。

数据中心冗余

组织内部部署的硬件故障和软件错误是不可避免的,但公共云为IT管理人员提供了应对这些问题的方法。公共云具有可用性集合、冗余数据中心、可用性区域和云区域,使管理人员能够在遭遇中断时更好地规划业务运营。这些策略很重要,但管理员必须设计可靠的应用程序,以利用公共云冗余功能。

组织IT资产的弹性更多地取决于应用程序而不是基础设施,这种想法与传统的思维方式不同。在过去的二十年中,管理员通过备份、复制和其他以基础设施为中心的技术保持弹性。但是对于绝大多数公共云平台来说,此策略不再有效。

近年来,云计算提供商遭受的损失已超过其承受能力。云计算提供商提供的云服务在出现中断时,行业厂商和用户似乎都在学习如何设计本地云冗余,管理人员希望将这些教训应用于传统的虚拟化数据中心冗余。

重新思考数据中心的冗余

对于大多数传统组织来说,一些基本的服务都是为防止停机而设计的。网络时间协议和网络路由等服务设计通常是高度冗余。然而,仅仅因为系统应该是冗余的,并不意味着其配置已经为利用自然冗余做好了充分准备。

一些核心服务并没有高度可用的选项。IT部门几乎总是面临必须处理的技术债务,这就要求对行为并不理想的遗留系统提供支持。例如,一些遗留的应用程序身份验证系统只能存在于服务器上,这限制了数据中心的冗余功能。

管理人员不应将所有鸡蛋放在一个篮子里。对于大多数的传统部署,最好在数据中心内部使用冗余硬件。管理人员可以通过使用不共享系统的冗余虚拟化群集来进一步采取这种策略,这类似于可以提供多个可用性区域的云计算提供商。这可以使应用程序依赖数据中心更高级别的冗余,但只有当业务需求保证该级别的冗余保护时才有价值。

通过在云平台和数据中心之间并行实施这些策略,在采用类似的传统基础设施时,使用公共云提供商的概念(如可用性区域)可能会有所帮助。这种术语使开发人员能够更轻松地理解基础设施概念,因为他们可能熟悉类似的云概念。

云计算冗余并不完美,停机中断提供了经验教训

高度冗余的系统不会免受性能下降的影响。在最近的公共云中断事件中,其目录服务无法使服务从一个区域保持运行到另一个区域。重新调整的流量超过其他区域的能力,使服务无法满足需求。

当管理人员设计数据中心冗余时,他们必须在发生中断时对负载进行规划。管理人员可能有两台服务器来支持数据中心冗余,但是其中一台服务器可能无法处理整个负载。关键是需要设计满足正常和异常状态下业务需求的系统。

许多组织都认为如果配置正确,在中断期间会发现其他情况。Netflix公司推出的Chaos Monkey系统就是人们所熟知的模拟中断事件,而其提供的经验教训是,如果管理人员没有练习处理实际的中断,他们永远不会知道IT系统将如何反应。而没有一个系统是孤岛,每个应用程序和服务都具有进一步使测试复杂化的依赖性。

停机中断在私有数据中心和公共云中并不罕见,但在数据中心内部,管理人员通常需要了解并理解系统的内部工作方式。当云计算提供商的服务出现中断时,可能会感到并没有从停机中学到什么教训,但这不是事实。虽然公共云提供商使用与传统数据中心不同的工具和方法,但有关构建和调整冗余的经验教训是通用的。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/5343.html

相关文章

  • 谨防计算监控的方法有哪些?

    摘要:尤其是云计算监控,已经引起了人们的广泛关注。云计算监控具有很多应用,但作为一种单独的解决方案,它充满了危险。企业必须注意这些危险,而不是认为可以单独依靠云计算监控。数据中心和IT运营经理长期以来一直认为,仅从防火墙后面进行监控并不能了解最终用户是否享受快速可靠的数字体验。这是因为防火墙之外还有大量的外部元素——第三方服务、ISP、CDN等等,这可能会影响最终用户在最后一英里的最终体验。最终用...

    dance 评论0 收藏0
  • 避免中断和提高系统性能的4种方法

    摘要:以下是避免云计算中断的四种方法,同时提高了流程中的安全性和性能采用多个地点或多云环境在多个地点或多个云计算提供商之间分配工作负载的企业可以增加冗余性和弹性,并且可以大大降低停机风险。当大多数人听到关于云计算中断的头条新闻时,他们通常考虑的是哪个云计算供应商,或其负面宣传将如何影响股票价格,却很少有人会想到事件背后的相关人员,也就是负责修复问题并让客户系统恢复运行的工作人员。尽管他们付出了最大...

    Integ 评论0 收藏0
  • 【物理主机 UPHost】产品简介:什么是物理主机?产品优势、地域与可用区、镜像、网络和安全以及

    摘要:云产品组合使用物理云主机可与云主机及多种产品无缝接入。物理云主机地域与可用区可用区是一组物理和电力上相互隔离的资源的组合。物理云主机的镜像目前仅支持,,和,且和云主机的镜像不互通。什么是物理云主机?UCloud物理云主机(UCloud Physical Host)提供专用物理服务器。提供出色的计算性能,满足核心应用场景对高性能及稳定性的需求,同时可以和其他云产品灵活结合使用。物理云主机UPH...

    Tecode 评论0 收藏0
  • 时代数据中心架构与安全浅谈

    摘要:考虑到云数据中心未来承载业务系统的多样性和扩容空间,一般都会把架构设计成公有云和私有云相混合的融合架构。针对传统灾备系统建设面临的挑战,云数据中心更多倾向采用两地三中心的解决方案。近年数据中心处于高速的建设发展时期,十三五规划中也将大数据、云计算作为当前国家经济社会发展的重要战略内容,各政府部门对战略性新兴产业的大力扶持,以及对云计算、物联网、宽带和下一代网络的发展的高度重视,都给建设数据中...

    yy736044583 评论0 收藏0
  • 什么是原生?

    摘要:可更新云原生应用程序始终是的,云原生应用始终可用。弹性云原生应用程序通过在峰值期间增加的资源来利用云的弹性。多租户云原生应用程序在虚拟化环境中工作,并与其他应用程序共享资源没有问题。云原生应用程序更加模块化,许多功能分解为微服务。云原生这个词被大量引用,尤其是云服务商。不仅如此,云原生甚至还有自己的基金会:由Linux基金会于2015年推出的云原生应用基金会(CNCF)。 云原生定义 ...

    Aomine 评论0 收藏0

发表评论

0条评论

jayzou

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<