伴随着通信网络向云原生架构的持续演进,SBC的虚拟化已经成为业界共识。SBC虚拟化具有以下特点:
适应通信网络发展的“新常态”。近年来,运营商面临着语音业务资费持续下降,营业收入不断萎缩的困境,为了降低建设和运维成本,支持业务按需快速部署,迫切需要实现资源集中和共享,虚拟化作为电信网络的主流演进策略,越来越受到业界的高度重视。
具有统一/通用硬件、分布式软件和按需分配资源等优点。虚拟化网元可运行在通用硬件平台上,实现传统电信功能的软硬件解耦;可支持硬件资源共享,CT/IT硬件实现最大程度统一; 媒体面可根据业务发展灵活申请资源,有效提高网络资源利用率。
综合成本低于物理SBC。虚拟化SBC硬件的采购成本和使用成本(功耗)约为传统SBC硬件的1.2倍,但支持弹性伸缩特性,据统计数据显示,其24小时内的平均资源利用率约为63.3%,因此综合成本仅为后者的75%-80%。
但是,现有基于CPU的虚拟化SBC的TC能力有限,无法满足大规模接入用户的需求,这一缺陷严重制约了虚拟化SBC的应用。为了解决这个问题,中兴通讯顺应虚拟化技术发展趋势,创造性地采用异构加速方法,引入基于CPU和GPU的虚拟化SBC(以下简称为vSBC)架构,充分发挥GPU硬件的能力,有效克服TC能力不足的“瓶颈”,从而为虚拟化SBC的普及奠定了基础。
GPU加速方法介绍
典型的SBC网元集成了信令处理、媒体处理和TC转码三种实体单元,具体地说,它包括了用户接入、呼叫处理、eSRVCC切换、紧急呼叫、网间互通和WebRTC等十多种媒体处理和相应的信令控制功能。
在这些功能中,TC转码是最主要的资源消耗“大户”,大约会占用一半以上的系统资源,因此硬件加速技术必不可少。但是面对种类如此繁多的需求,仅仅依靠CPU是难以满足的,必须通过CPU和GPU的联动才有可能较好地支持。
一般来说,虚拟化网络的CPU是珍贵资源,因此将TC等计算逻辑较复杂、算法变更频繁的业务分配给GPU/FPGA等加速硬件是最佳选择,而对于转发等低功耗、高转发、低时延、计算逻辑简单、算法变更较小的业务,目前暂不需要采用硬件加速。
中兴通讯vSBC的系统架构如图1所示。
图1 基于GPU的硬件加速系统架构
中兴通讯vSBC采用Nvidia公司的通用GPU系列卡,具有通用硬件、通用API、可共享等特点,各厂商可通过开放接口共享使用。
该GPU系列卡采用PCIe G3硬件接口和CUDA API通用软件接口,具有核数多(大于3000核)、主频高、逻辑计算单元少等特点,可支持虚拟化和多厂家多应用共享。其最大功耗仅为 250W,尺寸为 PCIe 全高全长,采用风扇散热方式,适合TC等需要大规模并行计算的应用,还可用于MEC、视频、大数据、加密、压缩和AI等场景。
在硬件方面,该GPU系列卡可以插入通用架式服务器;在软件方面,该GPU系列卡可以支持OpenStack P、Q版本、Linux和KVM等OS环境。
中兴通讯vSBC在数量、功耗、空间和成本方面具有绝对优势。通过采用基于GPU的TC硬件加速,中兴通讯vSBC的综合成本比仅采用基于CPU的虚拟化SBC降低50%以上,同时服务器数量得以减少,采购复杂度可明显降低。
按照通用的VoLTE话务模型(400万用户典型配置),这两种方法(分别简称为GPU和CPU)所需的TC资源和整机资源(采用架式服务器)的数量对比如图2所示。
图2 GPU和CPU两种方法所需的资源对比
中兴通讯vSBC对资源池的建设和管理基本上是“零”要求,而且还可以根据需要增加GPU卡资源或建设加速资源池。
中兴通讯vSBC新增了加速器及虚拟加速器资源模块,当发现含有加速硬件的主机/刀片时,NFVI将相应能力上报给VIM,由VIM对所有主机/刀片进行管理(包括资源配置、资源分配、资源释放、信息管理、性能管理等),以实现加速资源的虚拟化。
相应的资源池部署方式分为两种:一种是加速硬件和通用硬件分离,另一种是加速硬件和通用硬件合一,分别适用于不同应用场景,如图3所示。
图3 两种资源池部署方式
由于信令处理和媒体处理对时延的敏感度不同,两者一般部署在不同的资源池。
两种加速方法对比
综上所述,和传统的基于CPU加速方法相比,基于GPU的异构加速方法同样是成熟的通用方案,两种方法的转发加速方式相同,灵活性和运维方面的差别也不大,关键的不同之处在于后者的服务器数量和总成本只有前者的一半左右,不但网络性能得以提升,还有着较好的经济性,同时也明显降低了采购复杂度。
为了能直观地加以对比,下表简单罗列了两种方法的主要异同点。
类别
CPU方法
CPU+GPU方法
转发加速
DPDK
DPDK
TC加速
无
GPU加速(TC服务器数量为CPU方法的1/7)
性价比
良好
优秀(服务器数量、空间、成本为CPU方法的1/2,功耗为65%)
资源池
通用
通用(GPU通用硬件+通用API+共享+虚拟化)
网络运维
运维成本中等,扩缩容简单; 硬件统一/通用/集中,资源共享和按需申请
除左列的优势外,还有集成度更高,功耗/体积仅为CPU方法的1/2,部署更容易等
通用性
通用
通用(GPU可用于TC、加/解密、解压缩、转码、数据分析、AI等)
灵活性
好
很好(PCIe接口,即插即用;CUDA API, 软硬件解耦;多应用/厂家共享,可由第三方提供)
适配性
N/A
1、全长全高PCIe插槽
2、电源功率800W以上,高功率风扇
成熟度
成熟
成熟
结语
到目前为止,中兴通讯是业界唯一一家支持基于GPU的硬件加速的厂商,在该领域中拥有无可争议的领先地位。
通过这一创新性方法,中兴通讯vSBC的TC性能得到显著的提升,可以更好地满足VoLTE和将来5G语音的虚拟化需求,帮助运营商向用户提供更高性能的优质服务。
作者:洪钧 4/5G语音解决方案架构师 来源:C114通信网