技术随业务而生,业务载技术而行。
近些年来,伴随数字经济的发展,在众多企业的数字化转型之路上,云原生、DevOps、微服务、服务治理等成为行业内不断被探讨的新话题。人们在理解和接受这些新型概念的同时,也不断地思考其可能的落地形态。需求是创造发生的原动力,于是一批代表性的开源技术或者框架涌现而出:Kubernetes,Spring Cloud,Service Mesh,Serverless…… 它们炙手可热,大放异彩。然而在具体落地过程中却步履维艰,磕磕绊绊。
本文试图结合企业业务的核心诉求,以应用形态发展历程为背景,帮助企业梳理应用面向云原生、微服务转型中涉及的各种服务治理问题,以及服务治理的发展趋势。
什么是服务治理?
服务治理(SOA governance),按照Anne Thomas Manes的定义是:企业为了确保事情顺利完成而实施的过程,包括最佳实践、架构原则、治理规程、规律以及其他决定性的因素。服务治理指的是用来管理SOA的采用和实现的过程。
由定义可知,服务治理关键因素在于:应用形态、数据采集、信息分析、管控策略和协议规范五个方面。用户群体只有从这五个层次出发,才能构建出符合企业规范与要求的服务治理平台,从而进一步为企业创造商业价值。
01 “微观”塑形,服务一小再小
世界上唯一不变的是变化本身。----By 斯宾塞.约翰逊
万理同此,纵观应用形态发展历程,从单机到网络、从单体到服务化、到微服务、到Serverless,再到未来,应用的形态随着业务驱动和技术演化,一直在不断变化。随之而来的是业务需求的复杂化与多样化,企业IT面临着大规模、高并发、应用快速创新等新难题,弹性与敏捷成为企业IT的迫切需求。
在IT行业内有两个“不成熟”的理论:第一,每增加一行代码就会带来N种风险;第二,任何问题都可以采取增加一层抽象的方式解决。因此面对企业IT复杂的环境,“小而精”逐渐取代“大而全”,成为构建企业服务的首选方式,这也导致软件设计原则中的“高内聚,低耦合”又开始成为不断被高调吟诵的主角,微服务理念因此大行其道。
微服务架构为业务单元可独立开发和独立部署,使服务具备灵活的动态处理机能,同时依赖高度抽象化的组件工具和多元化的通信机制,向用户屏蔽所有服务之间的通信细节的这种思想提供了最佳落地实践。微服务的出现有效地缩短了服务上线周期,并且允许企业快速响应客户反馈,为客户提供所期望的可靠服务。
然而随着企业业务的发展与扩张与微服务的深入,服务数量向不可控的规模增长,服务数量的爆发式增长,为服务管理以及线上治理带来了极大的挑战。服务治理应运而生,成为构建微服务架构系统的必备“良药”。
02 “量化”管控,服务无可遁形
数字永远不会说谎。
如今,微服务已经成为软件架构的实际指导思想,而以Docker和Kubernetes为代表的容器技术的延伸,也有效解决了微服务架构下多个服务单元的编排部署问题。然而,微服务架构下也隐藏着容易被忽视的风险:面临规模巨大的服务单元,如何对其进行有效合理的管控与治理?
服务治理领域开始被行业与用户所重视,期望能够获得有效的思维方式和技术手段,应对由于不断激增的服务单元带来的服务治理挑战。关于服务治理,我们看到的更多的是其功能集合:服务注册发现、服务配置、服务熔断、网关、负载均衡、服务跟踪、日志采集、监控平台等。但当我们抛开这些名词解释,重新审视服务治理的时候,这些名词并没有完整的解释我们的困惑:如何设置负载均衡策略?采集日志格式是什么?服务配置如何生效?服务跟踪如何进行精确定位?
显然单单通过这些功能名词无法满足我们构建服务治理平台的需求,但从这些功能中我们总结出一些规律与方法,我们将从功能场景的横向切面和技术手段的纵深层次,进行如何构建一个有效的服务治理平台的分析探讨。
首先,我们从服务治理功能场景的横向切面来看,其可以抽象为四个层面:量化,追踪,管控,规范。
量化
量化包括服务数据采集、数据过滤和数据聚合三个层次。数据采集进一步细分为业务数据和性能数据,业务数据主要包括方法响应周期、服务内资源消耗规模、业务异常检测、方法调用次数、服务运行日志等;性能数据包括服务间响应时长、服务整体资源消耗等。
服务本身需要依赖不同的特性,构建不同的agent,来搜集服务运行时产生的数据。数据过滤针对采集的数据按照一定的格式规范进一步加工处理,例如基于kafka对原始的日志数据进行标准化处理后,导入日志系统。
数据聚合需要对独立的服务数据进行聚合操作,例如服务调用链呈现。
通过服务量化能够清晰的记录服务运行时产生的所有数据,为服务跟踪呈现和服务管控策略制定并提供强有力的数据支撑。
追踪
追踪能够有效量化服务调用链路上发生的事情,具体来讲,可以划分为:服务间的链路跟踪和服务内部的方法调用链路跟踪。追踪的本质,不仅仅是为了呈现服务链路及服务路由信息,更重要的是呈现服务间请求,以及服务内部请求的响应延迟,异常反馈,能够快速定位服务以及服务内在代码存在的问题。
管控
管控依赖于量化采集的聚合数据。管控允许运维人员聚焦某个服务单元的运行时状态,为服务设定一定的控制策略,从而保证服务稳定可靠的运行。例如熔断策略,负载策略,流量控制,权限控制等。
规范
规范更多针对服务通信而言,例如通信协议规范,无论针对哪种协议,例如http,tcp,rpc等都能够提供相应的检测手段。与此同时,规范也能够清晰定义服务名称和管控策略,使得服务在不同环境之间进行迁移的时候,依旧平稳可靠。
综上所述,在服务单元遵循一定规范标准的前提下,基于服务单元数据量化、服务调用跟踪以及服务策略管控的方式,才能构建出符合要求的服务治理平台。
接下来,我们从纵深的角度考虑构建服务治理平台过程中涉及的技术理论基础。服务治理之所以困难,原因在于构建业务系统采用的技术栈成多元化的方式存在。从目前行业内采用的技术而言可以划分为三大学派:代码集成、agent探针、流量劫持。
代码集成
代码集成往往需要业务开发人员的支持,在业务系统中嵌入数据采集代码,用来采集服务运行时服务产生的各种业务指标及性能指标,并将数据传输到云端治理平台。平台依据数据信息,通过配置动态下发,从而影响业务响应动态,完成服务治理功能。
优点:治理深入,端到端监控
缺点:维护繁琐,语言版本众多,影响业务性能
Agent探针
Agent探针是对代码集成的进一步提炼。Agent探针将需要集成的监控代码,高度提取、抽象、封装成可以独立集成的SDK,并且以“弱旁路”的方式与代码集成在一起,从而完成数据采集工作。云端治理平台,同样以采集的数据信息作为治理策略制定的依据,下发各种治理策略,从而达到服务治理功能。
优点:治理深入,端到端监控
缺点:语言版本众多,影响业务性能
流量劫持
流量劫持与前两者相比,与代码集成不同。它从网络通信作为切入点,以proxy的方式,代理业务单元所有的IN/OUT流量,并且proxy内部可以对请求数据进行一定的策略控制。从而完成服务通信的治理功能。
优点:无关语言差异性,维护简单
缺点:治理略浅,影响业务性能
综上所述,目前服务治理的技术栈或多或少都存在一些缺陷,在构建服务治理平台时往往需要采用结合的方式,才能做到物尽其才。
03 “百家争鸣”,成就未来
竞争成就未来。
从目前行业发展来看,微服务奠定了服务构建的基础方式,容器引擎以及编排技术解决了服务编排上线的困惑,下一个“兵家必争”的场景必将在服务治理。那目前行业内又有哪些项目聚焦在服务治理领域?
SpringCloud
SpringCloud作为Spring社区的重要布局之一,在微服务落地伊始就逐渐发力,当下已经成为Java体系下微服务框架的代名词,SpringCloud 以 Netfilx 全家桶作为初始化基础,为开发人员提供业务单元服务支撑框架的同时,也开发出一系列的服务治理SDK,供开发人员选用。在微服务发展背景下,SpringCloud可谓如日中天。
Dubbo
Dubbo原为阿里巴巴开源的 rpc 远程调用框架,初始设计初衷在于解决以 rpc 协议为标准的远程服务调用问题,随着阿里巴巴重启Dubbo,其也开始在服务治理领域发力,成为很多以rpc协议作为通信基础系统平台的首选。粗略而言,Dubbo和SpringCloud已成为Java体系下的服务治理“双枪”。
gRPC
gRPC与Dubbo类似,最初是由Google开源的一款远程服务调用框架。gRPC凭借HTTP/2和 RrotoBuf 服务定义方式以及多语言支持的特性,加之其易于定制与开发,能够方面开发人员进行快速扩展和灵活发挥,从而也成为众多用户的选择之一。
Service Mesh
Service Mesh的出现不在于它实现了多少功能,而是它彻底把业务单元与业务支撑体系分离,完整贯彻了“术业有专攻”的思想理念。它允许业务人员聚焦业务实现,不再关心服务治理相关的内容。通过与容器技术结合,下沉至基础设施,从通信协议的角度彻底接管业务通信交互过程,可谓微服务治理领域的后起之秀。
总而言之,服务治理的本质是针对业务与应用产生价值的收敛与反馈,只有不断地反馈和复盘才能构建出稳定、高效的应用形态。
原文 http://dockone.io/article/8986