5月15日,根据北京市生成式人工智能服务已备案信息公告,中国电信人工智能研究院(TeleAI)自主研发的星辰大模型已通过备案。今年2月星辰大模型已通过 “境内深度合成服务算法备案” ,“双备案”标志着星辰大模型可正式对外提供生成式人工智能服务。
TeleAI作为最早布局大模型的央企机构之一,坚持全链路完全自主研发创新,去年便发布了千亿参数“星辰”语义大模型,性能处于国内同级别参数模型的前列。同步构建了语义、语音、视觉及多模态等全模态完备的大模型基础框架,基于星辰大模型的各领域算法已获国际顶会AI竞赛冠亚军24项。TeleAI逐步形成涵盖5大领域的前沿布局:1个智算云底座、1个通用大模型底座、1个数据底座、M个内部大模型、N个行业大模型。
TeleAI积极通过开源推动大模型技术进步和大模型国产化进程。在中国电信CTO、院长李学龙带领下,加快研发创新,接连开源7B、12B、52B参数规模大模型,吸引国内外开源社区开发者广泛讨论和使用,开源模型下载量过万,积累超40W+用户。
本次开源的TeleChat-12B-V2(星辰12B-V2),采用3.7万亿tokens高质量中英文预训练数据进行训练,并在SFT数据部分,针对幻觉、逻辑推理方向数据进行定向提升。在通用问答能力上较之前版本提升5.5%,在多轮数学性能上提升40.3%。
同时,进一步开源更大参数的语言模型TeleChat-52B(星辰52B),52B模型使用更高质量的数据、更科学的数据配比,采用课程学习方式,在通用问答能力上大幅超过12B模型,整体性能比肩甚至超过GPT 3.5-Turbo。本次除了开源chat版本模型外,还开源了基于Deepspeed的全参微调和Lora微调方法,供大模型技术研究者和需求开发者进行自主训练微调模型。据悉,中国电信人工智能研究院表示年内预计将开源千亿级参数大模型,逐步构建全尺寸开源格局,通过更丰富的应用场景、更广泛的落地应用、更繁荣的行业生态,助力中国大模型技术进步与落地应用。
据悉,星辰大模型已广泛应用落地,赋能千行百业转型升级。星辰语义大模型已落地某市民生诉求场景,为市民提供在线文本问答服务,提升政务服务能力,提高市民满意度;语音大模型一体机落地某小学防霸凌项目,星辰语音大模型采用亿级参数进行推理,可在嘈杂环境下,实现报警关键词的精准识别预报警,智能应对各种校园霸凌事件;星辰视觉大模型融入多源跨横态信息,面向公安、县乡综治、基层治理等公共安全管理单位,提供视频图像解析、聚档、视频语义检索等能力,助力智慧城市建设。星辰多模态大模型累计研发15种文生图、55种图生图能力,落地海报生成场景和卡券生成场景。
此外,中国电信凭借在各行业深耕多年的优势和经验,联合头部生态构建了涵盖教育、政务、应急等20多个行业大模型,深入推动大模型与各行各业的融合,切实赋能千行百业转型升级。
星辰大模型通过 “双备案”后,将进一步为客户、生态伙伴、开发者及个人用户等提供前沿的AI能力,赋能千行百业变革的同时也提升个人工作效率和日常生活便利性,切实推进国内AI技术进步及落地应用,加速全社会迈向通用人工智能时代。
TeleChat-52B开源模型链接:https://github.com/Tele-AI/TeleChat-52B
TeleChat-12B-V2开源模型链接:https://github.com/Tele-AI/Telechat