VeloCloud Orchestrator 灾备模式部署

WHAT: VeloCloud Orchestrator Disaster Recovery (DR) 灾备模式部署

WHO: 针对VCO提供容灾方案

WHERE: VCO部署在数据中心内

WHY: VCO保存有全网设备配置信息和最近一年全网的网络状态数据库,如果出现宕机且没有备份,将会对全部的SD-WAN失去控制,因此需要异地灾难备份机制

WHEN: 一旦Active VCO彻底失效(如机房断电,网络全断等极端情况),需要Standby VCO接管整个SD-WAN网络


什么是High Availability (HA)和Disaster Recovery (DR):

HA一般认为是一主一备,当主节点出现问题时,可以及时的切换到备节点,当主节点恢复后,也可以切换回来

DR则是灾备模式,当主节点出现问题且不可恢复后,只能将业务切换至备节点

通过本文档,您将了解到:

  • 如何部署和配置VCO的灾备模式

  • 两台灾备模式的VCO之间如何通讯

  • 常见报错和解决方法

VCO灾备的建立流程

  1. 将两台独立(Standalone)的VCO分别部署在两个数据中心(IDC),并使用不同的公网IP映射,提供访问

  2. 两台VCO建立DR,两个数据中心没有DCI的线路互联

  3. 首先Active VCO会去访问Standby VCO,并用提前设置好的Operator SuperUser级别的账户进行登录

  4. 认证完成后,Standby VCO会访问Active VCO的地址,并通过TCP 22端口建立SSH通道

  5. 1607009400.png

配置过程

软件版本:

VCO build 3.4.3 (R343-20200804-GA-51e42f445a)

Tips:需要VCO软件版本一致

IP地址:

模拟暴露在公网的IP
Active VCO(主VCO) 192.168.50.100
Standby VCO(备VCO) 192.168.51.200

准备工作:

分别在两台VCO上新建Operator SuperUser账户专门用于灾备模式部署

主VCO新建账户replica@vmware.com

1606979797.png

备VCO也新建账户replica@vmware.com,此处最好账户名和密码与主VCO一致,减少后续出现问题的可能

1606979869.png

分别在两台VCO的System Properties中设置network.public.address地址

以Active VCO为例,Standby VCO也按照下述步骤操作

1606997713.png

1606997499.png

配置阶段:

将Standby VCO置为Standby模式

确认

再次确认

1606998547.png

Standby VCO处于Standby状态成功,处于Standby Candidate状态

1606998804.png

配置Active VCO,填入Standby Orchestrator Address / Standby VCO UUID / SuperUser username,password,使用Auto Configure Standby

1606999011.png确认Standby VCO的数据库将会被清空

1606999693.png

主备同步:

1607001140.png如果没有问题,最终会同步完成,由于实验环境的问题,Edge和Gateway没有连接到Standby VCO,不过数据库已经同步成功

1607002164.png


具备裸光纤互联的双数据中心

不需要通过VCO的业务接口进行同步,而可以通过第二网卡来进行同步

1607008526.png

前期准备工作类似,只是需要多配置一个网卡和系统属性

为Active和Standby VCO在vSphere上分别各增加一个网卡,并在VCO的虚机上配好IP,在System Properties中新建network.replication.address,并输入第二网卡的IP

1607003692.png

1607002937.png

同样,先启用备VCO的Standby,可以看到Orchestrator Secondary Address为10.1.1.2

1607005014.png

主VCO上填写对应的参数,需要多填一个Secondary Address 10.1.1.2

1607005303.png

同步完成后,可以看到同步是通过第二网卡的IP来完成的

1607006000.png在VCO上看socket连接,10.1.1.1:SSH是被10.1.1.2的备VCO连接的,192.168.50.100的SSH是管理的socket

1607006588.png

常见报错

没有配置network.public.address

1607007166.png

VCO版本不匹配

1607007194.png


参考文档

Configure VCO Disaster Recovery

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注