党的十九届六中全会明确提出,坚持开拓创新是百年来党领导人民进行伟大奋斗,积累的宝贵历史经验之一,进一步明确了要推进科技自立自强,强化国家战略的科技力量。新形势下,科技自立自强的重要性越来越突出。中国人寿保险股份有限公司(以下简称“中国人寿寿险公司”)一直以来坚决贯彻党中央的重大部署,不断寻求科技创新突破,逐步提升科技自主掌控比例,关键系统实现了全自主设计、开发、运营。在这些系统之下,中国人寿寿险公司自主打造的服务网格作为重要的IT基础设施,为推动科技自立自强注入了强大动力。
在数字化高速转型背景下,随着中国人寿寿险公司应用系统微服务化改造的落地,系统微服务规模大幅增长,异构系统间服务调用量呈指数级剧增,传统的中心化总线通讯,集中式服务治理存在的性能瓶颈愈发凸显。中国人寿寿险公司积极应对IT架构面临的挑战,践行“云原生”的核心理念,对IT架构进行重大革新,建立寿险业务的敏捷、稳定、高效云原生架构解决方案。云原生理念重新定义应用与基础设施的边界,核心是让开发者关注业务逻辑,让架构去承载系统复杂性。服务网格本质上是用于处理服务间通信的基础设施层,它高效实践了业务与基础设施分离的设计理念,是IT架构向云原生架构演进的关键一步。中国人寿寿险公司服务网格将服务的注册发现、路由、熔断等功能从应用程序中剥离,下沉至分布式的网格边车中,赋能应用实现“去中心化”的服务治理。同时为应用提供全链路、多维度的服务监控能力,及跨私有云、公有云的多云互联访问能力。为公司海量微应用间的服务通信及治理提供了企业级标准化解决方案。与传统的总线型结构相比,服务网格能够有效杜绝中心化服务模式存在的系统性风险,满足业务规模快速增长带来的服务间通信指数级剧增的需求。
这些复杂的技术描述可能难以理解,打个比方,如果把中国人寿寿险公司看作一个工厂,公司的各种服务就可以看作是工厂的很多车间。车间之间需要互相沟通,以前每个车间自己打电话到工厂的转接室,由转接室接通到相应的车间,这就是传统的总线型结构。随着工厂的发展,车间越来越多,车间沟通越来越频繁,转接室处理能力有限,严重影响了车间的沟通效率,一旦转接室出现故障,可能造成工厂所有车间都无法正常运转。服务网格相当于给每个车间都配备了一个叫作“边车代理”的小秘书,专门负责与其他车间沟通。小秘书之间彼此连接形成一张网,这样每个车间看上去像是在网格之中,服务网格由此而得名。当车间需要与其他车间沟通时,只需要告诉小秘书,小秘书就可以直接联系对方小秘书,同时把加密处理后的信息告诉对方小秘书,为车间提供安全、高效、可靠的通信。小秘书也会灵活地根据与其他小秘书沟通情况判断其他车间是否出故障了,所在车间是否负荷过重,并作出相应处理,通过停止通信或者限制通信等避免工厂出现大范围停工,从而提升稳定性,降低风险。同时,工厂设置了一个秘书室,统一管理小秘书,并根据小秘书反馈的信息,对工厂整体的运转情况进行监控和管理。
目前,服务网格已经深度应用在中国人寿寿险公司的各项服务之中,稳定支持着包括核心交易、客户服务、销售系统等在内的数十个关键系统的交易调用,为广大用户提供更稳定、更便捷、更安全、更高效的服务。
纵横贯通 服务运行更稳定
2019年服务网格上线以来,承载的系统和流量不断攀升,目前每天有数亿的流量平稳地运行在服务网格之上。服务网格作为下一代企业级战略产品,可以有效避免由于企业众多服务之间海量通信所引起的企业级服务风险,实现了服务并发调用支撑量到数亿级的跃升,确保为用户提供稳定可靠的服务,从根本上解决了中心化服务治理存在的性能瓶颈。
服务网格以分布式直连的架构模式替代中央集中式的管理方式。因此,在整个架构上,服务网格是分布式隔离的,所有的服务都通过“小秘书”代理直连,任何两个服务间流量异常时,不会波及其他服务间调用。同时,服务网格让应用具备了多环境部署的能力,应用的各个环境、版本独立运行在各自的“单元格”内,统一由网格进行管理。当某一个环境异常时,网格可以快速对异常环境做秒级服务故障隔离和自动流量切换,显著提升了系统稳定性和业务连续性。
多管齐下 服务治理更便捷
近期,一些精英业务员打开网销微投保,会发现国寿福盛典版等互联网长险产品已经可以使用全新的投保界面进行销售出单了,新的界面交互更加人性化,操作更加便捷,可以自动带出保费试算信息,无需再次手工录入。这些业务员被选中对这次版本升级进行预先体验验证,而大部分业务员对这次升级毫不知情,他们会在验证通过后随着新版本正式上线感受到变化。如同以往历次版本升级一样,这次也是通过服务网格的灰度发布,向指定的用户发布更新的版本,其他的用户仍然使用之前的版本,两个版本的用户各自使用,互不影响。
灰度发布是系统平滑升级的关键。它将待上线的服务版本和当前用户使用的服务版本放在服务网格的不同格子中,先让部分特定用户访问待上线的版本,经过特定用户验证通过后,逐步扩大发布范围至所有用户。就像一款新产品全面上市前,会先选取一些用户进行试用收集用户反馈,没有问题再进行全面发售,有问题就进行调整,而不会造成大范围的影响。以前为了避免服务中断,系统升级只能在夜间进行,时间受限而且效率低下。有了灰度发布以后,白天也可以在用户无感知的情况下完成系统升级,用户能够更快地享受到升级后的服务,开发者也不再需要苦苦通宵熬夜。依托于服务网格,中国人寿寿险公司的核心系统、销售系统、客户服务系统等数十个关键系统,月均灰度发布达到数百次,同时将灰度发布时间缩短至分钟级,极大地降低了灰度发布的成本,提升了为客户提供更优质服务的效率。
除了灰度发布之外,服务网格还提供了限流、熔断等多项服务治理能力,通过限制、中断单个服务的通信,避免局部服务问题造成公司服务大面积的瘫痪。此外,服务网格还为开发人员提供了统一管控视图的图形化界面,可以直观的对服务的访问权限、熔断、负载策略、流量控制等管控进行可视化配置。以往,由于应用系统种类繁多,采用的技术栈品类较多,一直无法形成统一的管控视图,服务治理是分散的、没有统一标准的。服务网格由于有“秘书室”统一管理“小秘书”,在管理层面有了提供统一管理视图的能力,使得以往分散的服务治理获得标准化、体系化、界面化的呈现及控制,管理的规范性、可回溯性、管理效率得到有效提升,服务管控能力得到空前强化。例如,应用灰度升级时,通过网格图形化界面,开发者可以灵活配置灰度策略,直观地观察灰度效果,快速调整用户访问量,而无需对应用程序本身做任何改动,服务治理变得更便捷、更高效。
密语传音 服务通信更安全
服务网格还一直为中国人寿寿险公司的服务安全保驾护航。近年来,随着云计算应用的普及,中国人寿寿险公司积极打造云计算平台,同时借助第三方云服务提供商的公有云平台能力,为用户提供更优质的服务。私有云与公有云服务通讯存在信息被窃取的安全风险,为了使公有云资源被安全使用,利用服务网格对中国人寿寿险公司私有云与公有云通讯信息进行加密,极大地提升通信的安全性,实现了一键加密,安全上云。例如,将AI智能服务部署在公有云上,针对销售系统提交的相关信息,服务网格会对相关信息先进行加密,然后调用公有云上的AI智能服务,确保了在公有云上服务通讯的信息不被窃取、篡改,从而保证了相关信息的通讯安全。
私有云与多公有云组成的混合云是未来技术发展的主流方向,信息安全是应用系统能否使用公有云资源的关键。服务网格安全体系以透明的方式为应用系统自动签发、安装部署、更新安全证书(SSL Certificates)。赋能应用实现一键加密能力,让应用在无感知的情况下,在网络通信层快速建立起安全的信息通信加密通道,保证信息通讯的机密性、防篡改性。同时,基于双向证书认证机制,自动识别应用证书颁发者的身份信息,确保交易双方都具有合法身份,可以有效屏蔽非法身份的中间人攻击及其他骚扰攻击。最后,基于角色的访问控制(RBAC),可以针对源端、目的端资源路径等多维度进行更细粒度的权限控制。
服务网格建立了企业级的应用通信安全体系,有效降低了大量、多语言应用的安全防护成本,为应用系统安全、高效使用混合云奠定了技术基础。在服务网格的助力下,中国人寿寿险公司AI智能服务等多个服务已经成功投放在阿里、腾讯、华为公有云上,中国人寿寿险公司的云服务迈入了私有云与公有云共存的混合云时代。
以简驭繁 应用开发更高效
在使用服务网格之前,服务注册、服务发现、流量控制、访问控制等等这些服务治理能力,虽然和为客户提供的业务本身关系不大,但是都需要应用自身编写代码实现。特别是异构系统、多语言应用,第三方开源框架层出不穷,开发难度、成本居高不下。就好比一个小型工厂,老板既管经营又管生产,既要从其他工厂买材料,又要制作产品,所有的事情都需要他自己完成,如果大家还说着不同的语言,沟通起来就更加困难,成本很高。当客户一多,就会手忙脚乱,严重影响效率。
使用服务网格之后,服务网格通过将服务治理交给边车代理“小秘书”,实现业务程序和非业务程序解耦,将服务治理能力下沉到网格基础设施,使开发人员不用再关注非业务代码,只需要将精力全部聚焦在业务逻辑上,开发变得更简单、更高效,用户提出的业务需求能够更快被实现。使用了服务网格的工厂,不再需要关心原料购买、产品运输,只需要专注做好产品,其他的事情全部交由“小秘书”处理。经统计,通过对接服务网格,对应用代码进行瘦身,开发效率提高了约30%。
服务网格进一步轻量化了应用,让开发团队可以快速上线标准化、易扩容的分布式系统,在实现提质增效的同时,开启了分布式应用系统开发的新纪元。
服务网格于2016年由美国Buoyant公司首次提出。2018年,服务网格在国内还未被大家熟知的时候,中国人寿寿险公司就开启了服务网格的探索,并且从此一直走在了金融保险行业的前列。2019年,中国人寿寿险公司服务网格初步上线,就荣获了《金融电子化》杂志颁发的“金融科技创新突出贡献奖开发创新贡献奖”。今年8月,凭借着持续领先行业的技术创新性和应用深入性,又摘取了IDC(国际数据公司)“未来企业奖未来数字创新领军者优秀案例”、“金融行业技术应用场景创新案例奖金融中台优秀案例”两项大奖,获得业界高度认可。
中国人寿寿险公司服务网格建设取得连连突破,但离全面服务网格化的目标还有一定差距。未来,中国人寿寿险公司将持续发力服务网格等创新技术应用,不断加强核心技术自主掌控,坚持科技自立自强,朝着建设“科技国寿”的战略目标奋勇前进。