8月30日,在中国移动第四届科技周暨战略性新兴产业共创发展大会主论坛上,中国移动集团级首席科学家冯俊兰博士代表中国移动面向业界正式发布了7个网络智能化开放数据集。该数据集围绕网元智能、运维智能、服务智能三大方向建设,是业界首个涵盖无线信道、基站、云网、核心网、哑资源等多领域,支持感知、诊断、预测、决策等多类网络AI能力研发的标志性数据集。本次发布,是中国移动积极落实网络强国战略、打造网信大国重器的重要举措,为促进我国通信网络与人工智能技术融合发展贡献了重要创新资源。
为什么要开放高质量网智数据集
通信网络是数字经济发展的基石,提升通信网络的智能化水平,建设高度数字化、智能化的自智网络是不仅是当前ICT产业技术创新的热点方向,更关系到数字经济的发展新动能。长期以来,通信行业缺少具备行业影响力、公信力的通信网络公开数据集,尤其是有现网特色的真实、多样的规模性数据,制约着网络智能化关键技术的发展与突破,业界对高质量数据集需求迫切。
首批开放的数据集覆盖多种场景
首批开放的7个网智精品数据集,来自于移动现网不同领域的生产创新需求,经过数据清洗及治理,总数据量达到上亿,已经在中国移动一线维护、优化、服务保障等领域的生产实践中经过了充分验证,具有现网真实性、多样性、数量多、种类全,覆盖广的特点,涵盖网络智能感知、预测、诊断、决策等多项能力场景,能够为网络智能化创新能力研发孵化提供数据基础。数据集详情如下:
CSI压缩反馈:复杂信道环境的无线信道状态信息数据及实测数据集,数据量级达到60万条。该数据集可用于训练CSI压缩反馈等网元智能模型,压缩UE侧的信道特征信息,并实现信道状态信息的无损还原, 实现快速准确的CSI压缩反馈能力, 提升反馈精度、降低反馈开销。
光网络哑资源合规检测:2万张光交箱、通信杆、光缆等五类场景图片数据集,该数据集可用于训练网络视觉模型,对传输线路中可能存在的哑资源进行检测和识别,打造安全可靠、稳定运行的光纤传输网络。
无线侧故障根因分析:现网丰富的无线网络运维告警数据和故障工单数据,涵盖130类告警及23类故障原因,数据量级达到460万条。该数据集可用于训练故障根因分析模型,高效快速地定位故障问题,从而 减少实际派单数量,优化派单策略,节约人工成本。
无线链路质量预测:5G 多样化业务应用场景下2万条高精度时间分辨率下的无线网络状态参数及相应用户业务下行速率信息数据,该数据集可用于训练无线链路质量预测模型,预测用户业务下行速率,实现无线链路状态实时感知,提升用户视频业务体验和无线网络服务能力,达到网络和业务协同的用户体验跨层智能优化。
无线小区多指标时空序列预测:无线通信场景下现网长时间(2个月)、大规模(万量级)移动通信小区历史序列数据,数据量级达到亿条,涵盖流量、用户数等重要指标及多维度小区属性信息,该数据集可用于训练时空联合序列预测模型,预测 多项小区性能指标的演变趋势, 从而为网络规划和维护工作制定更精准智能的优化策略。
算网异常检测及故障定位:算力网络环境下网络云化设备运行日志数据,包含154类异常标注,数据量级达到60万 条。该数据集可用于建立有效的云网异常检测模型和根因分析算法模型,实现快速准确的云设备故障检测并定位故障原因,提升网络运维效率。
网络拓扑优化:面对现网环境拓扑负载不均衡的挑战,现网10万条网络拓扑连接关系和网元属性数据,该数据集可用于建立智能网络优化模型 ,探索网元流量的变化规律,并据此对网络拓扑结构进行动态优化,实现网络负载均衡,提高网络的性能和可靠性。
数据集的发布得到业界的高度认可
本次数据集的发布得到了中国移动各级领导和相关部门的大力支持。
中国移动集团公司副总工程师、集团级首席科学家王晓云表示:“高质量数据是实现人工智能高质量发展的核心要素。中国移动倾力构建的这批网络精品数据集,瞄准的是解决网络智能化领域长期数据资源不足、技术创新路径受限的产业难题。相信中国移动的贡献,一定能够为我国人工智能,特别是网络智能化领域的技术研究、产品研发、人才培养、生态建设带来全新动能。”
中国移动集团公司技术部总经理陈洪涛表示:“本次开放的7项网络数据集,覆盖了多领域的网元、运维、服务智能场景,具有很强的移动通信行业特色和应用价值,这也是中国移动建设“智慧网络国家新一代人工智能开放创新平台”的重要举措之一,后续中国移动将持续发挥自身优势,为产业开放更多的创新资源,更好的促进我国通信+AI技术的融合创新与突破。”
中国移动研究院院长黄宇红表示:“中国移动构建的网络数据集,既着眼当下又面向未来,不仅能够助力现网运维优化等领域的人工智能算法创新,也能服务下一代网络的前沿技术研究、方案验证、模拟仿真和标准化等。中国移动期待能基于数据集的建设和不断发展,与产学研各界勇闯网络新技术无人区,共同构建我国信息通信技术新优势!”
中国移动集团级首席科学家,研究院人工智能与智慧运营中心总经理冯俊兰表示:“中国移动正在构建业界领先的网络大模型,深刻感受到高质量数据的重要意义,也深知数据集的开放共享对于产业的巨大价值。我们希望以本次数据集的建设和发布为新的起点,能在网络智能化技术创新方面汇聚更多的产业力量,携手攻克智慧网络的科学难题,共同实现通信网络AI+X的发展新范式。”
中国移动集团公司网络事业部副总经理顾宁伦表示:“中国移动充分发挥自智网络子链的产业带动作用,依托现网丰富多样的数据优势,挖掘网络智能化痛点问题和生产需求,体系化构建多领域、大规模的移动网络特色数据集。相信本次发布的数据集能够有效助力网络智能感知、诊断、预测、决策等领域的技术创新,助力我国自智网络加快演进升级。”
同时,业界专家对本次数据集的发布也给予了高度关注和充分肯定。
北京邮电大学理学院副院长、北京邮电大学-中国移动研究院联合创新中心主任张建华教授表示:“展望6G,将是通感算智深度融合的移动通信信息网络。全面、海量、精确的通信网络数据集,是6G技术研究和产业发展的亟需。我们期待并相信中国移动网智数据集的开放将为6G与 AI的深度融合技术创新提供宝贵的数据要素。北邮与中国移动研究院成立联合创新中心以来,在6G信道测量平台与数据集共建方面取得了丰硕成果,共同发布了面向6G AI空口的信道数据集。今后我们将继续深化合作,持续建设发布优质数据集,服务产业发展需要。”
新华三集团行业事业部副总裁、移动系统部总经理王栋良表示:“在新一轮的产业变革中,人工智能正在释放科技革命和产业革新的巨大能量。而数据,则是这股能量的关键源泉。自2021年开始,新华三便开始建设AI数据集,我们坚信,只有充分挖掘数据的潜力,才能推动算法不断升级,加速产业突破。新华三积极支持移动研究院数据资源开放共享的建设,提供了大量AI数据集,充分挖掘数据集潜力,期待与大家携手共同推动数据集的落地,助力数字产业发展变革。
未来,中国移动将依托“智慧网络国家新一代人工智能开放创新平台”,建设并开放更多优质网智数据集,为我国通信领域智能化技术突破、产业发展和通信+AI复合型人才的培养做出更大的贡献。
开放网智数据集服务入口:
https://jiutian.10086.cn/open/#/setlist?platform=OpenInnovation