中国电信星辰大模型通过双备案！ 52B模型已全面开源

发布: 2024-05-20 14:58 | 作者: MSCBSC | 来源: 移动通信网 | 字体: 小中大

5月15日，根据北京市生成式人工智能服务已备案信息公告，中国电信人工智能研究院（TeleAI）自主研发的星辰大模型已通过备案。今年2月星辰大模型已通过 “境内深度合成服务算法备案” ，“双备案”标志着星辰大模型可正式对外提供生成式人工智能服务。

TeleAI作为最早布局大模型的央企机构之一，坚持全链路完全自主研发创新，去年便发布了千亿参数“星辰”语义大模型，性能处于国内同级别参数模型的前列。同步构建了语义、语音、视觉及多模态等全模态完备的大模型基础框架，基于星辰大模型的各领域算法已获国际顶会AI竞赛冠亚军24项。TeleAI逐步形成涵盖5大领域的前沿布局：1个智算云底座、1个通用大模型底座、1个数据底座、M个内部大模型、N个行业大模型。

TeleAI积极通过开源推动大模型技术进步和大模型国产化进程。在中国电信CTO、院长李学龙带领下，加快研发创新，接连开源7B、12B、52B参数规模大模型，吸引国内外开源社区开发者广泛讨论和使用，开源模型下载量过万，积累超40W+用户。

本次开源的TeleChat-12B-V2（星辰12B-V2），采用3.7万亿tokens高质量中英文预训练数据进行训练，并在SFT数据部分，针对幻觉、逻辑推理方向数据进行定向提升。在通用问答能力上较之前版本提升5.5%，在多轮数学性能上提升40.3%。

同时，进一步开源更大参数的语言模型TeleChat-52B（星辰52B），52B模型使用更高质量的数据、更科学的数据配比，采用课程学习方式，在通用问答能力上大幅超过12B模型，整体性能比肩甚至超过GPT 3.5-Turbo。本次除了开源chat版本模型外，还开源了基于Deepspeed的全参微调和Lora微调方法，供大模型技术研究者和需求开发者进行自主训练微调模型。据悉，中国电信人工智能研究院表示年内预计将开源千亿级参数大模型，逐步构建全尺寸开源格局，通过更丰富的应用场景、更广泛的落地应用、更繁荣的行业生态，助力中国大模型技术进步与落地应用。

据悉，星辰大模型已广泛应用落地，赋能千行百业转型升级。星辰语义大模型已落地某市民生诉求场景，为市民提供在线文本问答服务，提升政务服务能力，提高市民满意度；语音大模型一体机落地某小学防霸凌项目，星辰语音大模型采用亿级参数进行推理，可在嘈杂环境下，实现报警关键词的精准识别预报警，智能应对各种校园霸凌事件；星辰视觉大模型融入多源跨横态信息，面向公安、县乡综治、基层治理等公共安全管理单位，提供视频图像解析、聚档、视频语义检索等能力，助力智慧城市建设。星辰多模态大模型累计研发15种文生图、55种图生图能力，落地海报生成场景和卡券生成场景。

此外，中国电信凭借在各行业深耕多年的优势和经验，联合头部生态构建了涵盖教育、政务、应急等20多个行业大模型，深入推动大模型与各行各业的融合，切实赋能千行百业转型升级。

星辰大模型通过 “双备案”后，将进一步为客户、生态伙伴、开发者及个人用户等提供前沿的AI能力，赋能千行百业变革的同时也提升个人工作效率和日常生活便利性，切实推进国内AI技术进步及落地应用，加速全社会迈向通用人工智能时代。

TeleChat-52B开源模型链接：https://github.com/Tele-AI/TeleChat-52B

TeleChat-12B-V2开源模型链接：https://github.com/Tele-AI/Telechat