当前位置: 北极雀 >> 北极雀的形状 >> 一文读懂蓝绿发布AB测试和金丝雀发布的
背景
目前,业界已经总结出了几种常见的服务发布策略来解决版本升级过程中带来的流量有损问题。本文首先会对这些普遍的发布策略进行简单的原理解析,最后结合阿里云的云原生网关对这些发布策略进行实践。
发布策略
被业界广泛采用的服务发布策略包括蓝绿发布、A/B测试以及金丝雀发布。
1、蓝绿发布
蓝绿发布需要对服务的新版本进行冗余部署,一般新版本的机器规格和数量与旧版本保持一致,相当于该服务有两套完全相同的部署环境,只不过此时只有旧版本在对外提供服务,新版本作为热备。当服务进行版本升级时,我们只需将流量全部切换到新版本即可,旧版本作为热备。由于冗余部署的缘故,所以不必担心新版本的资源不够。如果新版本上线后出现严重的程序BUG,那么我们只需将流量全部切回至旧版本,大大缩短故障恢复的时间。待新版本完成BUG修复并重新部署之后,再将旧版本的流量切换到新版本。
蓝绿发布通过使用额外的机器资源来解决服务发布期间的不可用问题,当服务新版本出现故障时,也可以快速将流量切回旧版本。
如图,某服务旧版本为v1,对新版本v2进行冗余部署。版本升级时,将现有流量全部切换为新版本v2。
当新版本v2存在程序BUG或者发生故障时,可以快速切回旧版本v1。
蓝绿部署的优点:
1、部署结构简单,运维方便;
2、服务升级过程操作简单,周期短。
蓝绿部署的缺点:
1、资源冗余,需要部署两套生产环境;
2、新版本故障影响范围大。
2、A/B测试
相比于蓝绿发布的流量切换方式,A/B测试基于用户请求的元信息将流量路由到新版本,这是一种基于请求内容匹配的灰度发布策略。只有匹配特定规则的请求才会被引流到新版本,常见的做法包括基于HttpHeader和Cookie。基于HttpHeader方式的例子,例如User-Agent的值为Android的请求(来自安卓系统的请求)可以访问新版本,其他系统仍然访问旧版本。基于Cookie方式的例子,Cookie中通常包含具有业务语义的用户信息,例如普通用户可以访问新版本,VIP用户仍然访问旧版本。
如图,某服务当前版本为v1,现在新版本v2要上线。希望安卓用户可以尝鲜新功能,其他系统用户保持不变。
通过在监控平台观察旧版本与新版本的成功率、RT对比,当新版本整体服务预期后,即可将所有请求切换到新版本v2,最后为了节省资源,可以逐步下线到旧版本v1。
A/B测试的优点:
1、可以对特定的请求或者用户提供服务新版本,新版本故障影响范围小;
2、需要构建完备的监控平台,用于对比不同版本之间请求状态的差异。
A/B测试的缺点:
1、仍然存在资源冗余,因为无法准确评估请求容量;
2、发布周期长。
3、金丝雀发布
在蓝绿发布中,由于存在流量整体切换,所以需要按照原服务占用的机器规模为新版本克隆一套环境,相当于要求原来1倍的机器资源。在A/B测试中,只要能够预估中匹配特定规则的请求规模,我们可以按需为新版本分配额外的机器资源。相比于前两种发布策略,金丝雀发布的思想则是将少量的请求引流到新版本上,因此部署新版本服务只需极小数的机器。验证新版本符合预期后,逐步调整流量权重比例,使得流量慢慢从老版本迁移至新版本,期间可以根据设置的流量比例,对新版本服务进行扩容,同时对老版本服务进行缩容,使得底层资源得到最大化利用。
如图,某服务当前版本为v1,现在新版本v2要上线。为确保流量在服务升级过程中平稳无损,采用金丝雀发布方案,逐步将流量从老版本迁移至新版本。
金丝雀发布的优点:
1、按比例将流量无差别地导向新版本,新版本故障影响范围小;
2、发布期间逐步对新版本扩容,同时对老版本缩容,资源利用率高。
金丝雀发布的缺点:
1、流量无差别地导向新版本,可能会影响重要用户的体验;
2、发布周期长。
实践
接下来,我们会基于阿里云的容器运维平台ACK以及MSE云原生网关对以上介绍的三种发布策略进行实践。这里我们采用最简单的业务架构来展示,即一个云原生网关、一个后端服务(响应中返回当前版本信息)和注册中心。注册中心决定了业务架构中服务发现方式,我们会分别以K8s容器服务和Nacos两种服务发现机制来实践不同的发布策略。
1、前提条件
创建了阿里云容器运维平台ACK创建了MSE云原生网关创建了MSE注册中心Nacos(服务发现方式为Nacos时需要)
2、服务发现方式:K8s容器服务
在这个例子中,我们使用K8s原生的服务发现方式,即通过声明式ServiceAPI资源将后端服务注册到CoDNS。例子中的后端服务提供一个查询当前版本的接口/version,并且当前版本为v1。云原生网关深度集成ACK,可以实时动态地从ACK集群中获取服务信息,方便通过云原生网关将该后端服务暴露给外部用户。
业务架构如下图:
1、部署
将以下资源(Service和Deployment)应用到ACK集群,完成后端服务的部署和发布,当前应用版本为v1。
apiVersion:v1kind:Servicemetadata:name:
转载请注明:http://www.aideyishus.com/lkzp/2709.html