在近日举办的第七届数字中国建设峰会上,中国电信人工智能研究院宣布了一项技术突破,发布了业内首个能同时识别30种方言的语音识别大模型——星辰超多方言语音识别大模型。这一创新技术打破了传统单一模型仅能识别特定方言的限制,为语言文化的传承注入了新的活力。
中国是一个语言多样性极其丰富的国家,“百里不同俗,十里不同音”的现象十分普遍。方言作为地域文化的重要组成部分,其保护和传承显得尤为重要。然而,由于方言种类繁多,语法语音特征各异,传统的方言研究方式依赖大量的人力进行主观感知和标注,工作量大且标注难以系统化。在此背景下,AI技术的介入无疑为方言的保护和研究带来变革。
星辰超多方言语音识别大模型的发布,正是基于AI技术的高效与系统性对方言进行整理归纳的重大成果。该模型不仅能同时识别包括粤语、上海话、四川话、温州话等在内的30多种方言,更在丰富性和质量上居于行业前列。这得益于中国电信人工智能研究院构建的超过30种、总计超过30万小时的高质量方言数据库。
在技术研发方面,中国电信的研发团队首创了“蒸馏+膨胀”联合训练算法,有效解决了在超大规模多场景数据集和大规模参数条件下预训练可能出现的坍缩问题。
目前,星辰语音大模型已在福建、江西、广西、北京、内蒙古等地的中国电信10000智能客服进行试点应用。通过接入星辰大模型,智能客服能够迅速理解30种方言,日均处理电话量达到约200万通,极大地提高了服务效率和用户体验。此外,该模型还在多个城市的12345市民服务平台得到应用,为市民提供更加便捷的服务。
星辰超多方言语音识别大模型的发布和应用,不仅展示了AI技术在语言文化传承方面的巨大潜力,也为中国电信在人工智能领域的研究和应用增添了新的亮点。