C114讯 4月11日消息(赵婷婷)在近日召开的“2024年云网智联大会”上,中国电信研究院副院长傅志仁应邀作了题为《基于云网融合的智算网络发展的实践及思考》的主题报告。他指出,从2022年开始,智算算力在新增算力中的占比已经超过50%,并逐渐成为算力主体。
傅志仁援引国家信息中心发布的《智能计算中心创新发展指南》数据指出,“十四五”期间,在智算中心实现80%应用水平的情况下,对智算中心的投资可带动人工智能核心产业增长约2.9-3.4倍、带动相关产业增长约36-42倍,智能算力成为支撑经济发展的新引擎。
从智算算力应用场景看,极端场景大模型训练是需求也是要求最高的。“我们整个算力需求发展非常高,每年4倍甚至10倍的发展,根据英伟达预测,未来十年每年算力会增长4倍,十年以后累计会增长100万倍。”他说道。
从网络层面看,如何支持AI大模型和训练,傅志仁总结为“四个超”:首先是超大规模,“提到现在都是万卡,中国电信在北上广建立万卡集群,对能源的需求会非常高。”二是超低时延,动态的时延由10微秒到1毫秒时,GPU有效计算时间将降低10%;三是超大带宽,相对于100G的组网,1.6Tbps超带宽网络使得单次迭代训练耗时减少32%;四是超强可靠,对丢包率有更高要求,特别对一些关键的千份之一的丢包导致算力损失。
从产业挑战看,当前的资源建设和供给无法满足快速增长的需求,这受限于多种因素。一是产业及能源,短期内无法建设超大规模集约型数据中心;二是持续运营,将智算中心作为拉动GDP非常重要的举措,期望值高,“但整个大模型训练周期较长,如何保证客户能用起来,提高利用率、周转率、产业链和生态薄弱,相比国外的英伟达比较成熟的CUDA体系,我们国内现在还有很多需要做。”