当数据中心成为新的计算单元,BlueField-3实现业务加速增长

(魏德龄/文)在如今高速率与低时延在各种用例中已成为重要前提条件的时代,传统的冯·诺依曼架构由于大大依赖单一的CPU或GPU进行计算,已经无法解决日益严重的网络拥塞的问题。以数据为中心的新架构则解决了这一问题,通过让“数据在哪,计算就在那”,从而大大降低通信延时。英伟达的BlueField-3与DOCA软件开发包所构建出的DPU生态系统正在让更多业务受益于这种新架构,让数据中心成为新的计算单元。

数据中心成为新计算单元

以BlueField为代表的DPU的出现正是为以数据为中心的计算架构而生,它的存在实现了业务和基础设施操作的分离,大幅降低了长尾延时,而长尾延时正是影响业务性能的巨大瓶颈所在。

UCloud技术专家马彦青就对基于InfiniBand网络的DPU与以太网进行了举例对比,他表示:“试想一个研究生或博士在2-3年时间里,如果能用InfiniBand网络把计算量缩短一半或1/3,也就是意味着他们在读研和读博期间会有更多的论文产出量。而在石油勘探领域,如果把这种数据、计算和勘探模型的计算缩减一半以上,那意味着它整个油田的勘探也会缩短时间。”

英伟达在今年的GTC上正式发布了BlueField-3,相比上一代产品,它具有5倍加速计算能力、16个Arm A78 CPU核,和4倍的加解密速度。BlueField-3也是首款支持第五代PCIe总线并提供数据中心时间同步加速的DPU。

值得一提的是,BlueField-3也是业界首款速度达到400Gb/s的DPU,英伟达将会在BlueField-3上推出400Gb/s的Ethernet或InfiniBand接口。客户可以使用BlueField-3来实现400Gb/s的加解密速度(无论是用IPSec还是TLS),而以往使用CPU时,即便使用200G的网络,把CPU资源完全耗光,也只能跑到30-40Gb/s。

释放最大性能

无疑,BlueField-3充分实现了把合适的计算放在合适的地方,进而释放最大的性能。除了上文马彦青举例的在实际用例中可以缩短科研或勘探时间外,在安全、网络、存储、AI与HPC等业务场景上都能实现加速。

在安全业务上,BlueField-3可以实现从IP层,传输层以及到MAC层的400Gb/s全线速在线加解密,当使用RegEx和DPI做深度包检测时,速度可以达到50Gb/s。据NVIDIA网络事业部亚太区市场开发高级总监宋庆春透露,从BlueField-3以后,会对未来加密计算开始做铺垫,到BlueField-4以后可以真正实现加密计算。

在网络业务中,BlueField-3专门对RDMA、Connection Tracking、ASAP2等这些网络通信技术做了进一步加强,特别是对时间精度,可在数据中心和边缘之间做非常及时的时钟同步。

在存储业务中,BlueField-3可以实现以往不可能做到的事情,可以做到Block storage、File storage、object storage或者NVME storage的仿真,还可以对storage在数据落盘时加解密的操作进行硬件卸载,甚至是各种签名操作都可以分流到DPU上。

对于AI与HPC而言,BlueField-3可以执行通信框架,实现无阻塞通信,告别以往通信时不计算,计算时不通信的局限,实现通信与业务的分离,进而可让一些业务的性能提升30%-40%。

DPU生态系统兴起

除了能够释放全部性能的亮眼表现外,DPU生态系统目前也已经兴起,得到了操作系统厂商、应用厂商,以及云、安全、存储等各个领域厂商的广泛支持。

例如NVIDIA和VMWare共同开发的Monterey Project,该项目中,VMware把Hypervisor里的一些功能分流到DPU上,从而使Virtualization环境下Infrastructure的相关CPU工作实现由DPU所取代,实现了业务与Infrastructure操作的完全隔离。值得注意的是,这也是首次VMware把其源代码开放给合作伙伴,来共同开发基于VMware企业级的云解决方案,足见DPU的魅力所在。

VMware 云平台业务部营销副总裁 Lee Caswell在BlueField-3发布时曾表示: “我们共同的客户都在竞相利用AI赋能其企业应用。那些基于VMware Cloud Foundation的企业基础设施将得到最新发布的NVIDIA BlueField-3 DPU的认证,目的就是为用户提供一个新的思路来提高应用性能、为虚拟化环境和裸金属环境提供一致的操作模型,以及在确保业务性能的前提下提供一个全新零信任安全模型。”

专为助力BlueField合作生态系统而生的DOCA软件开发包,可以通过DOCA来实现软件定义网络、存储、安全,可在其中进行各种操作,开发人员可以通过DOCA和BlueField硬件关联起来,直接调用到硬件的加速引擎。

UCloud就通过DPU与DOCA简化了UCloud裸金属网络架构,解决了原VPC网关架构下服务器集群成本高、上联交换机与网关带宽瓶颈的问题。简化之后,VPC管理整体集成至DPU内部,在提高转发效率的同时,带宽性能也大大提高。

据悉,下一代BlueField-4还将会集成GPU,让更多AI模型也能跑在DPU上,针对GPU的编程接口也会整合到DOCA里,DPU生态系统无疑将近一步壮大,更多的创新案例也将不断涌现。


微信扫描分享本文到朋友圈
扫码关注5G通信官方公众号,免费领取以下5G精品资料
  • 1、回复“YD5GAI”免费领取《中国移动:5G网络AI应用典型场景技术解决方案白皮书
  • 2、回复“5G6G”免费领取《5G_6G毫米波测试技术白皮书-2022_03-21
  • 3、回复“YD6G”免费领取《中国移动:6G至简无线接入网白皮书
  • 4、回复“LTBPS”免费领取《《中国联通5G终端白皮书》
  • 5、回复“ZGDX”免费领取《中国电信5GNTN技术白皮书
  • 6、回复“TXSB”免费领取《通信设备安装工程施工工艺图解
  • 7、回复“YDSL”免费领取《中国移动算力并网白皮书
  • 8、回复“5GX3”免费领取《R1623501-g605G的系统架构1
  • 本周热点本月热点

     

      最热通信招聘

      最新招聘信息

    最新技术文章

    最新论坛贴子