近日,中国移动智算中心(哈尔滨)正式宣布上线投产,成为全球运营商最大单集群智算中心。
该智算中心单集群内配备了超过18000张AI加速卡,智能算力规模高达6.9EFLOPS。凭借其单集群算力规模之最、国产化网络设备组网规模之最,傲视群雄。
此项集群规模不仅采用了高性能无损网络、全调度以太网GSE1.0、融合分级存储等一系列创新技术,还搭载了移动云智算平台和智管平台,支持万卡并行训练、断点续训、AI任务全生命周期管理及分钟级故障定界定位等功能。这些功能使得集群算效与能效均达到了行业领先水平。
该集群也是继中国移动智算中心(呼和浩特)(全球运营商最大单体智算中心)上线运行后,中国移动打造的业内首个端到端使用全国产设备的超大规模智算集群,标志着我国国产芯片商用部署达到了新的高度。
该智算中心通过把所有AI加速卡整合为一个集群,并运用先进的智算网络技术,将上万块GPU芯片高效拼接,数据训练完成时间缩短了20%,满足万亿参数大模型的训练需求。