WHAT: VeloCloud Orchestrator Disaster Recovery (DR) 灾备模式部署
WHO: 针对VCO提供容灾方案
WHERE: VCO部署在数据中心内
WHY: VCO保存有全网设备配置信息和最近一年全网的网络状态数据库,如果出现宕机且没有备份,将会对全部的SD-WAN失去控制,因此需要异地灾难备份机制
WHEN: 一旦Active VCO彻底失效(如机房断电,网络全断等极端情况),需要Standby VCO接管整个SD-WAN网络
什么是High Availability (HA)和Disaster Recovery (DR):
HA一般认为是一主一备,当主节点出现问题时,可以及时的切换到备节点,当主节点恢复后,也可以切换回来
DR则是灾备模式,当主节点出现问题且不可恢复后,只能将业务切换至备节点
通过本文档,您将了解到:
-
如何部署和配置VCO的灾备模式
-
两台灾备模式的VCO之间如何通讯
-
常见报错和解决方法
VCO灾备的建立流程
-
将两台独立(Standalone)的VCO分别部署在两个数据中心(IDC),并使用不同的公网IP映射,提供访问
-
两台VCO建立DR,两个数据中心没有DCI的线路互联
-
首先Active VCO会去访问Standby VCO,并用提前设置好的Operator SuperUser级别的账户进行登录
-
认证完成后,Standby VCO会访问Active VCO的地址,并通过TCP 22端口建立SSH通道
配置过程
软件版本:
VCO build 3.4.3 (R343-20200804-GA-51e42f445a)
Tips:需要VCO软件版本一致
IP地址:
模拟暴露在公网的IP | |
Active VCO(主VCO) | 192.168.50.100 |
Standby VCO(备VCO) | 192.168.51.200 |
准备工作:
分别在两台VCO上新建Operator SuperUser账户专门用于灾备模式部署
主VCO新建账户replica@vmware.com
备VCO也新建账户replica@vmware.com,此处最好账户名和密码与主VCO一致,减少后续出现问题的可能
分别在两台VCO的System Properties中设置network.public.address地址
以Active VCO为例,Standby VCO也按照下述步骤操作
配置阶段:
将Standby VCO置为Standby模式
确认
再次确认
Standby VCO处于Standby状态成功,处于Standby Candidate状态
配置Active VCO,填入Standby Orchestrator Address / Standby VCO UUID / SuperUser username,password,使用Auto Configure Standby
确认Standby VCO的数据库将会被清空
主备同步:
如果没有问题,最终会同步完成,由于实验环境的问题,Edge和Gateway没有连接到Standby VCO,不过数据库已经同步成功
具备裸光纤互联的双数据中心
不需要通过VCO的业务接口进行同步,而可以通过第二网卡来进行同步
前期准备工作类似,只是需要多配置一个网卡和系统属性
为Active和Standby VCO在vSphere上分别各增加一个网卡,并在VCO的虚机上配好IP,在System Properties中新建network.replication.address,并输入第二网卡的IP
同样,先启用备VCO的Standby,可以看到Orchestrator Secondary Address为10.1.1.2
主VCO上填写对应的参数,需要多填一个Secondary Address 10.1.1.2
同步完成后,可以看到同步是通过第二网卡的IP来完成的
在VCO上看socket连接,10.1.1.1:SSH是被10.1.1.2的备VCO连接的,192.168.50.100的SSH是管理的socket
常见报错
没有配置network.public.address
VCO版本不匹配