北京2023年8月11日 /美通社/ -- 8月10日,2023年开放计算中国社区技术峰会(OCP China Day 2023)在北京举行。智慧时代,计算多元化、应用多样化、技术复杂化正驱动数据中心新一轮变革,开源开放社区已成为推动数据中心持续创新的重要力量,通过全球化协作与创新,合力解决数据中心基础设施迭代与可持续发展等重大问题。
自2019年以来,OCP China Day已经成为一年一度业界领袖探讨开放计算技术和创新的年度盛会。本届峰会由全球最大的开放计算社区OCP主办、浪潮信息承办,以“Open Momentum:智能化、可拓展、可持续”为主题,聚焦数据中心基础设施创新与可持续发展、开放计算创新与生态建设、社区协作创新等议题,来自OCP Foundation、微软、浪潮信息、三星、安谋科技、抖音、晶丰明源、阿里云、京东云、美团、燧原科技等在内的社区领袖、技术大咖、行业专家,以及千余名IT工程师和数据中心从业者参与大会。
五大组织聚首,开源开放打破创新边界
数字经济与实体经济、数字世界与物理世界的深度融合,正在推动数据中心加快创新的速度。但日趋复杂的技术与推陈出新的应用,使得信息技术服务商与企业越来越难以驾驭数据中心的全面创新。以全球化协作为核心宗旨的各类开源开放社区应运而生,并逐渐成为数据中心创新的重要力量。
OCP基金会首席执行官George Tchaparian表示:“开源开放精神的核心是倡导自由平等、共享共治的全球化协作创新,通过最大程度的开放和协作,激发超乎想象的创造力,催生激动人心的创新。随着数字技术越来越复杂,社区的进步不仅有赖于友好顺畅的协作开发流程以及完备的社区治理机制,同时也需要加强跨社区的合作与共享,不断拓展创新的边界。”
出于数据中心软硬协同发展的考虑,跨社区合作已被开源社区领袖和成员们日益重视。本届峰会汇聚了OCP、OCTC开放计算标准工作委员会、OpenPOWER基金会、国内领先的开源OS根社区、CXL技术联盟五大开放社区和组织的社区领袖,从不同角度共同探讨了如何构建软硬高度协同的数据中心基础设施。
CXL联盟创始成员、前总裁、OCP Server项目组牵头人Siamak Tavallaei表示,OCP正在开展一系列CXL相关的活动,如可组合内存系统、数据中心就绪的模块化硬件系统,和扩展连接性工作流,以研究和记录基于PCIe和CXL的NVMe和可解耦数据中心的未来计算、存储、加速器和内存连接场景的通用性和差异性。
国内领先的开源OS根社区理事长马涛认为,开放计算的兴起,极大地加快了硬件创新的速度,推动了软件定义功能的集成以及效率的提升。社区致力于打造面向云时代而生的下一代操作系统,以云场景为中心驱动研发创新,能够突破摩尔定律失效后计算产业发展驱动力不足的问题,高效推动软硬件生态高度协同发展。
OpenPOWER基金会主席Meow Yee表示,开放计算让硬件敏捷的创新成为可能,其价值已在过去十余年间得到反复验证。OpenPOWER基金会致力于充分发掘Power ISA,Open Firmware,Power cores等OpenPOWER相关资产的领先技术优势,积极联合遍布全球的会员组织,构筑更加开放协作共赢的生态系统,不仅加速开放硬件行业创新,也同时支撑并加速开源软件的创新。
OCTC开放计算标准工作委员会秘书长陈海表示,融合将是下一代数据中心发展的基本方向,这种融合不仅需要软硬件高度协同,更需要将开放计算的创新成果与通用行业应用需求进行融合创新。OCTC致力于面向架构融合创新,以开放共建、协同创新构建全球领先的规范和标准,加速开放计算在全产业落地,推动ICT产业高质量发展。
左手技术右手标准,开源开放要创新与落地并重
在技术创新上的独特模式与精妙的设计思维,是开放计算不断壮大的核心所在;而标准的建设则是开放计算落地的基础。正是因为开放计算对技术与标准的并重发展,才让越来越多的用户得以享受开放技术的红利,让开源开放的精神更加深入人心。
本届峰会集中展示了包括CXL高速交换技术、SONiC开放网络、54V直流供电、钛金电源、液冷等在内的一批热门数据中心技术,这些技术正为开放数据中心的场景创新赋予更多可能。同时,峰会上还发布了面向生成式AI应用场景的《开放加速规范AI服务器设计指南》,进一步发展和完善了开放加速规范AI服务器的设计理论和设计方法,提速多元算力普惠的进程。
内存解耦与池化一直是业界的热点与难点,但以CXL为代表的高速串行缓存一致性总线的出现,给主机和远端共享内存之间提供了低延时的访问路径以及缓存一致性保证,为大规模内存扩展与内存资源池化提供了可能。CXL技术是一种新型的高速交换技术,旨在提供更高的数据吞吐量和更低的延迟,以满足现代计算和存储系统的需求。CXL的目标是消除CPU和设备、设备和设备之间的内存鸿沟,通过内存与主机的解耦,在逻辑上构建可远端共享的内存资源池,让多台主机访问同一个内存池,大大提高数据交换的效率,并实现动态内存扩展。
三星在会上展示了支持CXL 2.0的512GB CXL DRAM,支持PCIe 5.0接口,采用EDSFF(E3.S),加速下一代存储解决方案的商用化,从而帮助企业将有限的资源重新投资于增强服务器内存中去,加速扩大CXL生态体系。浪潮信息在本届峰会上发布并现场展示的融合架构3.0原型系统以开创性系统架构设计实现了计算资源、存储资源、内存资源、异构加速资源等核心IT资源彻底解耦与池化,通过硬件重构和软件定义颠覆了数据中心传统架构。其中,基于CXL高速交换技术,融合架构3.0原型系统率先在单系统内实现内存资源池化、亚微秒级远端内存访问、细粒度多主机共享等高级特性。
随着越来越多的业务实现数字化,数据中心的网络流量激增,催生了更大的网络带宽需求,网络解耦也由此成为实现网络资源灵活扩展和敏捷运维的一种现实而迫切的需求。开放网络通过网络硬件设备与软件代码的分离,实现了网络的软硬解耦,创造出一种更加灵活、敏捷和可编程的网络架构。从OCP发起的SONiC已经成为主流的开放网络技术,得到越来越多的企业和组织的支持,目前社区成员数量超过60家,支持平台数量超过100种。未来,SONiC除了继续增强可编程性和支持端计算之外,一个重点就是增强对网络智能化硬件的支持。
生成式AI是当下最受关注的技术领域之一,峰会上面向生成式AI应用场景发布了《开放加速规范AI服务器设计指南》,助力社区成员高效开发符合开放加速规范的AI加速卡,并大幅缩短与AI服务器的适配周期,为用户提供最佳匹配应用场景的AI算力产品方案。开放加速规范(OAM)由OCP下设的OAI小组推动制定,该标准主要用于指导AI硬件加速模块和系统设计。
除OAM标准之外,OCP的标准规范已覆盖到数据中心基础设施的各个环节,包括机房、机柜、服务器、存储、网络设备、电源、液冷、云端硬件等等。2022年成立的冷却环境项目已成为OCP迄今最大规模的跨行业合作项目,多家公司甚至多个行业的代表共同聚焦数据中心液冷技术创新。该项目整合了包括高级冷却解决方案(ACS)和高级冷却设施(ACF)在内的5个子项目,如ACS冷板子项目、ACS门式热交换器子项目、ACS浸没式液冷子项目、余热利用子项目等等,目标是通过数据中心不同冷却方法之间的跨项目协调,实现上述子项目和物理接口之间的标准化,从而加快数据中心内部、附近和周边的创新步伐。
事实上,数据中心可持续发展的技术方案正得到越来越多OCP社区成员与用户的重视,可持续发展已成为一种社区共识。浪潮信息服务器产品线总经理赵帅认为,促进数据中心可持续发展已经成为必须采取的行动,从开发环保产品,到使用清洁能源改善能源结构,到应用液冷技术降低碳排,乃至电子垃圾回收及再利用,可持续发展的理念应贯彻数据中心生命周期的始终。
在软硬协同发展思想的推动下,开源软件和开放硬件正加快融合,开放开源技术将深刻改变全球IT产业分工协作模式。未来,越来越多的跨社区合作将进一步打破创新的边界,以更加开放的数据中心为业务创新赋予无限可能。