5月25日,中电信人工智能科技有限公司&中国电信人工智能研究院(以下简称“人工智能公司”)在2024智算云生态大会全方位展示了在人工智能领域的最新技术成果和创新实力,让观众身临其境地感受到中国电信天翼AI的技术魅力和品牌力量。
作为推进新质生产力发展的关键代表性技术,AI目前已经成为全球科技创新主体争相角逐的焦点。大会主论坛上,人工智能公司总经理何忠江介绍了星辰大模型向多模态通用智能升级的阶段性成果,并展示了自主研发升级的星辰语音大模型及星辰视觉大模型,彰显了中国电信在人工智能领域的又一次重大突破。
星辰语音大模型,支持30多种方言识别
有没有能听得懂方言的智能客服?星辰语音大模型给出了肯定的答案。本次大会重磅亮相的星辰语音大模型,是由人工智能公司自主研发的业内首个支持30种方言自由混说的强大引擎。得益于“蒸馏+膨胀”联合训练算法、超大规模语音预训练和多方言联合建模,星辰超多方言语音识别大模型能够同时识别和理解包括粤语、上海话、四川话、温州话等在内的多种方言,打破了传统语音识别系统通常仅适用于特定方言的局限。
何忠江介绍,人工智能公司的研发团队构建了一个超过30种方言、30万小时以上的高质量方言数据库,该系统不仅大大降低了推理时的语音传输比特率,而且让沟通更加自然流畅,解决了老年人及老少边穷地区信息服务无法触达的问题,架起了通往AI时代沟通的桥梁。他表示,发布会后,语音大模型的算法代码和训练代码将面向社会全部开源开放,希望业界同仁能够用中国电信的大模型底座发挥更好的商业价值和学术价值,跟大家一起共建中国方言的AI体系,使方言数字化、AI化,让方言不要消失在历史的长河中。
星辰视觉大模型,从感知智能迈向认知智能
人工智能公司发布的TeleSearch视觉大模型同样引发业界关注。TeleSearch是星辰视觉大模型最新3.0版本,它构建了面向千种场景的新一代大规模视频AI解析系统,通过整合多源跨模态信息,实现了精准的跨模态理解。它解决了数据采集难、算法精度低、任务碎片化、开发周期长等行业痛点,突破了小模型样本采集、模型训练、精度对齐的传统流程,助力解决长尾小模型难题。
何忠江介绍,星辰视觉大模通过高维空间文本信息和像素信息分割和对齐,实现了视频中的万事万物均可通过自然语言检索。它采用了自然语言化的算法,能够实现零样本即时定制,建立了分钟级迭代的新一代大规模视频AI自学习闭环体系,这一颠覆传统模式的体系使得处理任意定制需求及规模化发展成为可能。与此同时,该框架结合了大模型、向量检索和模型量化等技术,支持亿级规模的文搜图、图搜图的检所匹配。它还支持标注、训练、推理的一体化操作,聚焦“一句话布控”和“万物检索”两种核心业务,端到端地解决“寻人找物”、“安全生产”、“合规督查”等业务场景难题,实现了一键式部署,无门槛使用,为千行百业赋能。
更多AI软硬件产品集中亮相
在展馆中,中国电信星辰语音、语义、视觉、多模态大模型等创新技术悉数亮相,为观众带来了深刻的体验。观众可以现场体验到AI生成的“簪花写真”,感受福建非遗文化“簪花”在天翼AI大模型赋能下焕发的新魅力。人工智能公司还提出了一种大模型驱动的异构智能体协同控制算法框架――大模型智能体,其赋予了异构智能体系统高层语义理解、技能认知和复杂任务执行的能力。在此基础上,人工智能公司还将大模型智能体搭载了离线大模型,开发出了大模型离线智能导盲犬,实现了智能人机交互、智能乘梯引导、智能过街引导和智能室内引导等功能,全方位为观众展示了离线具身智能范式的可行性和潜力。
同时,更多AI应用集中展示了人工智能公司的自研实力。其中包括:能够智能对话的数字人系统,集视频接入、解析、管理、应用于一体的星辰大模型一体机;可应用于校园内、园区内等多元场景的星辰语音大模型一体机;为客户提供一站式的数据服务和应用解决方案的星海大数据AI融合平台;还有星辰大模型平台体验、星辰慧记、AIGC文创、AI智能听力机等诸多产品,用前沿科研能力赋能千百行业。
人工智能公司肩负时代使命责任,紧跟国家重大战略方向,积极开展“人工智能+”行动,强化关键技术自主研发,不断夯实AI核心基础能力和生态建设,致力于为用户带来更加智能便捷的服务体验,同时也为加快数字经济高质量发展、全面推进数字中国建设贡献“电信力量”。