自研大模型、打造“智能体”，vivo打开叙事新空间

发布: 2023-11-03 10:00 | 作者: MSCBSC | 来源: 移动通信网 | 字体: 小中大

飞象网讯（高靖宇/文）近年来手机产业发展进入创新期，手机厂商正试图寻找新的差异化出路。特别今年以来，随着ChatGPT的横空出世和全民级应用发展趋势，众多手机厂商纷纷入局AI大模型赛道，成为当下最火热的技术赛道。

而在这场大模型竞赛中，vivo显然走在了前列。11月1日，在2023 vivo开发者大会上，vivo正式发布自研蓝心大模型BlueLM、OriginOS 4、自研蓝河操作系统BlueOS。其中，蓝心大模型是vivo自研通用大模型矩阵，从开源到完全自研历时6年，包括十亿、百亿、千亿三个不同参数量级的5款自研大模型，全面覆盖核心应用场景，并将大模型矩阵能力全面融入到OriginOS 4。这意味着，vivo端侧大模型已从前沿技术探索进入到应用和产业级落地新阶段。

大模型与手机结合之后，智能手机又有了新叙事，为未来智能手机发展探索出新方向。vivo副总裁、OS产品副总裁周围预判，未来手机的发展趋势或将进化为“智能体”。

如何将大模型装入手机？答案是：端云协同

通过类似ChatGPT、文心一言的APP就能使用大模型，为什么还要把大模型装入到手机端侧呢？这是因为，与单纯在云端部署生成式 AI 应用和服务相比，手机终端侧部署生成式 AI 可以实现在设备端运行复杂的AI算法，从而减少对云端服务的依赖，个人私密信息也不用上传的云端，保障数据安全。此外，手机可以更好地理解和响应用户的需求，从而满足用户对更加智能化手机的期待。

那么，大模型千亿级的参数量如何在手机上流程运行，此时端云协同的混合架构就成为关键。vivo的蓝心大模型包含有10亿、70亿、700亿、1300亿、1750亿五种参数规模，其中10亿量级模型是主要面向端侧场景打造的专业文本大模型，具备本地化的文本总结、摘要等能力。70亿模型是面向手机打造的端云两用模型，具有优秀的语言理解、文本创作能力，同时，上述两个量级的模型支持高通和MTK最新旗舰双平台端侧化部署，在保证数据安全的同时，在出词速度、响应时间、内存占用等方面也非常优秀，实现了安全与性能的双重并举。

vivo同时在做的有10亿、70亿、700亿、1300亿、1750亿五种参数规模的蓝心大模型，其中10亿和70亿已经可以由本地算力支撑，而更大的数据仍然需要运行在云端。为此，vivo并不会强制用户必须使用端侧或者云端，而是交给用户自己去选择，比如隐私保密性不需要那么高的输入法等功能，可以选择在云端运行，而公司文件、相册等，就可以利用手机本身的算力来完成。

700亿模型是面向云端服务的主力模型，其综合能力，在C-Eval、CMMLU、SuperCLUE（10月）等榜单中均处于中文大模型的第一梯队。另外1300亿、1750亿模型也将在更复杂的场景中以更丰富的知识和推理能力为用户带来更专业的智能体验。

除了与云端协作，手机大模型还面临算法和算力的挑战。vivo整个团队花了六年多时间不断解决问题，在算法方面，在预训练阶段，vivo利用最前沿的Transformer架构，改良了注意力机制、位置编码等关键模块，并在包含了3.3万亿词的大规模多语言数据集上进行训练，最终使得蓝心大模型具备了超强的基础能力。算力上，vivo也在积极通过信息技术应用创新去解决算力问题，组建了一只150人的工程团队，持续地提升集群的效率，目前vivo千亿模型训练周期低于2个月，百亿模型不到2周。

目前，vivo构建了超过100万条高质量的多语言多任务指令数据进行学习和训练，从而让蓝心大模型更好地理解用户的意图，适应各种目标任务。并在安全部署中通过了中国信通院内容审核服务系统评测，在文本、语音和视频内容识别需要检测的15个大类中，14个大类获得最高的5星等级，1个获得4星等级。