北京2023年8月28日 /美通社/ -- 8月24日,以"智算 开新局·创新机"为主题的2023浪潮信息新产品"互联网+AIGC"行业巡展暨大模型智算软件栈 OGAI 发布会在北京重磅开幕。来自百川智能、快手、金山办公、京东云等互联网行业的专家、大咖和生态伙伴汇聚一堂,探讨互联网行业如何把握生成式AI机遇,并分享大模型时代的智算发展之道。
浪潮信息董事长彭震在致辞中表示:"人工智能算力已经成为驱动大模型进化的核心引擎,但是大模型研发经常会面临买不起,建不了,算不好的困境。我们唯有不断创新智算产品技术,结合大模型领域的实践经验,把智算力转化为业务创新力,才能走在AI时代的前列。"
当前,AI计算已经成为大模型产业发展的核心竞争力之一。OpenAI公开数据显示,从GPT-3到GPT-4算力当量增长了68倍,算力依旧是大模型能力提升的核心驱动力。百川智能技术联合创始人陈炜鹏表示:"大语言模型发展规律之一是模型的能力随着计算量扩展,且目前为止我们还没有看到模型的边界。"
要满足大模型对于算力的迫切需求,需要构建强大的智算基础设施。然而智算系统的构建并不是算力的简单堆积,业内普遍意识到大模型训练是如同造火箭一样的复杂系统工程,需要综合考量算力系统的部署、优化、资源调度,数据的采集、清洗、处理,模型训练、推理、迁移、调优以及应用服务、生态构建等一系列问题。
解决大模型的算力挑战,已经成为产业创新共同努力的方向。浪潮信息高级副总裁、AI&HPC总经理刘军表示,为了更好的释放大模型的生产力, 第一、要让算力系统的效率充分发挥,大模型开发就是在抢时间,效率等于时间和金钱;第二、可扩展性,对于动辄万卡的算力集群系统来说,并行计算策略关乎性能扩展比;第三、要保证训练过程中算力供应的可持续性,充分考虑硬件、软件、算法、框架层面引发的训练中断、失效的问题。我们需要从系统层面整体设计,帮助企业跨越大模型研发门槛。陈炜鹏表示,百川智能正在探索提升大模型训练效率以及研发成功率。快手异构计算负责人刘凌志表示,模型参数量增长超过一定阈值时,智能能力也会表现出跃迁式的提升。面对视频和大模型带来的算力挑战,快手从音视频、AI和数据中心技术入手,深入开发了SL200芯片,实现行业领先的视频压缩效率,并通过StreamLake品牌把基础设施和AI、视频的原子能力赋能产业。
目前,由智算赋能的大模型已经在互联网行业得到了广泛应用,作为大模型应用推进代表企业,金山办公技术总监熊龙飞分享了大模型在办公领域落地的实践:"办公场景AI发展趋势是先满足公网用户需求,再到私有化部署,从单模态变成多模态,从高度依赖大模型原生能力变成更丰富的技术融合,从对话式交互变成更轻度的点击选择交互。"
要推动大模型智算系统的建设,现代化数据中心是关键载体。大模型对于数据中心带来了能耗、算力结构等方面的多重挑战。京东云高级硬件系统架构师王贵林,分享了京东构建大规模数据中心的最新思考:"通过硬件技术创新、软件架构优化以及清洁能源的使用等一系列手段,构建低碳、环保、可持续、智能的全生命周期的数据中心,将成为释放智算力的强大支撑。"
与会嘉宾指出,中国大模型仍处于商业生态发展初期,需要在智算系统构建、平台支撑、算法研发、应用落地等层面进行广泛的生态合作,从而打造更为卓越的大模型,并推动模型的场景化落地,从而真正赋能互联网行业变革。