飞象网讯(魏德龄/文)“手机用得好好的,为什么要换?”这或许是近年来很多人产生换机冲动时,所必须直面家人的灵魂拷问。诚然,手机的CPU与GPU性能在近年来依旧在稳步前进,但对于不进行大型3D游戏的用户来说,所产生的日常使用提升正在变得微乎其微。
不过,随着ChatGPT在2023年的异军突起,也为智能设备的需求瓶颈给出了一个靠谱的答案。从应用商店排行榜上来看,即便过了发布后下载热潮的ChatGPT客户端,如今仍能占据苹果App Store排行榜前20位,各类基于开发接口所打造的第三方App或插件更是不计其数。
尽管热度不小,但其实用户在移动端的体验确实谈不上好,但好用又不好用的生成式AI却又映射出了未来“换手机”时的新答案。
好用又不好用的生成式AI
生成式AI至少已经成为了潜在的杀手级应用,ChatGPT自2022年11月推出后,短短两个月内其月活用户便达到 1 亿,成为有史以来增长速度最快的消费类应用。大型聚合网站的数据显示,目前已有超过 3,000 个可用的生成式 AI 应用和特性。据初步估计显示,生成式 AI 市场规模将达到 1 万亿美元 ,广泛覆盖生态链的各个参与方。
ChatGPT 和 Stable Diffusion 等生成式 AI 模型能够基于简单的提示创作出全新的原创内容,如文本、图像、视频、音频或其他数据。这类模型正在颠覆传统的搜索、内容创作和推荐系统的方法――通过从普通产业到创意产业的跨行业用例,在实用性、生产力和娱乐性方面带来显著增强。 建筑师和艺术家可以探索新思路,工程师可以更高效地编写程序。几乎所有与文字、图像、视频 和自动化相关的工作领域都将受益。
但相比于通过网页在线与ChatGPT进行对话,并获得相应的生成式AI结果,移动端使用生成式AI时有着并不相同的使用场景,用户往往不能拥有一个稳定高速的云连接环境,所以相比响应迅速、节能高效的移动智能时代来说,使用云端生成式AI时,用户仿佛回到了智能手机初期发展的时代,生成式AI在搜索、翻译上所带来的强大能力让人用后很容易产生粘性,但又需要在使用中多上一份耐心,多等待下云端的思考与转圈圈,才能获得自己想要的答案。
另一方面,如同当下很多公司的云策略已经从公有云变为混合云的背后逻辑,单纯依赖于某一家的云端算力,显然不够安全,用户的所有对话均会被单一厂商所收集,隐私问题将会变得棘手。同时,如果用户或公司严重依赖某一家公司在云端所带来的AI能力,也不利于在未来灵活地使用各种工具。
完全依靠云端的AI算力,也带来了能耗的问题。伴随着ChatGPT的大热,业内的一个有趣观点就是,AI的瓶颈将是数据中心的散热问题,很多水冷方案也借此应运而生。同时,当本地设备进行大数据量的通信交互时,同样会产生较大的能耗,进而给网络带来压力,并影响本地设备的续航。
不过,如同在当下已经成为主流之选的混合云,混合AI成为了让生成式AI能够实现体验升级与规模化扩展的良方。
混合AI实现体验提升
“当前很多人将生成式AI和云端联系在一起,而通过高通的技术,我们能够让这些出色的用例在边缘侧实现。”高通技术公司产品管理高级副总裁兼AI负责人Ziad Asghar在上月的高通AI业务媒体沟通会上表示。
同期,高通还发布了《混合AI是AI的未来》的白皮书,在第一部分专门为混合式AI做出了如下定义:混合 AI 指终端和云端协同工作,在适当的场景和时间下分配 AI 计算的工作负载,以提供更好的体验,并高效利用资源。
通过终端侧AI算力与云端的结合,恰恰能够解决目前生成式AI完全依靠云端而出现的各种隐忧。例如在功耗方面,如果在云端运行一个超过10亿参数的生成式AI模型,可能需要数百瓦功耗的话,但在终端侧运行需要的功耗仅有几毫瓦。
另以高通在今年巴展期间所带来的Stable Diffusion在Android终端上的演示为例,能够在15秒内完成20步推理,生成包含细节的图像,整个过程全部在本地化进行,即使手机设置成飞行模式,也能完成根据文字描述所进行的绘画创作任务。这种特性既为用户带来了更加灵活高效的使用方式,又大大提升了隐私保护性。
混合式AI还能让更多类型的终端受益,例如骁龙本通过生成式AI能够基于视频会议的语音转录内容,制定任务清单,并自动生成完整的演示文稿直接供用户使用,使生产力能够成倍增长;XR设备能够借此实现文本生成 3D 和视频生成 3D 类的模型,最终或能让用户踏入从零开始生成的 3D 虚拟世界;汽车能够通过生成式AI根据出发点和目的地信息,结合汽车的丰富传感器数据制定不同的路线规划,找到最佳路线;物联网领域,生成式 AI 可以利用简单提示帮助商店经理重新排列货架商品,为利润高的产品腾出空间,或者利用附近连锁店的数据,尽可能降低产品缺货情况的发生。
“随着我们不断打造和扩展高通公司‘统一的技术路线图’,我们将核心的硬件、软件以及工具技术扩展到不同产品线。开发人员只需要进行一次开发,就可以将开发成果和经验应用于其他使用高通技术和平台的产品上。”Ziad Asghar表示高通的AI能力不仅能扩展至不同的终端,还能让AI应用实现在各类产品上的快速落地。
显然,相比于CPU、GPU在性能过剩时代对于游戏表现的提升,AI能力的提升在办公、影音、日常生活中所带来的提升将给绝大多数用户带来理由充分的换机动机,而AI的性能与应用领域也将如同曾经智能手机CPU主频从600MHz到1GHz、再到2GHz的时代一样,迎来快速提升期。
智能设备的新刚需
“最终,AI 能力将成为用户选购下一款手机、PC 或汽车的主要影响因素。”《混合AI是AI的未来》白皮书第二部分中写到。
只要关注近年来高通骁龙技术峰会上的骁龙8系平台的发布环节就能发现,AI早就已经成为了每次高通着重升级并介绍的重点。如今随着生成式AI迎来iPhone时刻,高通为终端侧所预埋的AI算力,可谓是金子终于迎来了发光时刻。
早在2007年,高通在骁龙平台上便推出了首个 Hexagon 处理器。2015 年,骁龙 820 处理器推出,集成了首个专门面向移动平台的高通 AI 引擎,以支持图像、音频和传 感器的运算。2018 年,骁龙 855 中为 Hexagon 处理器增加了张量加速器。2019 年,高通在骁龙 865 上扩展了终端侧 AI 用例,包含 AI 图片、AI 视频、AI 语音和始终在线的传感器中枢。
2022年发布的第二代骁龙8 为整个系统提供了开创性的 AI 技术,搭载了迄今为止最快、最先进的高通 AI 引擎。Hexagon处理器实现全新架构升级,包括微切片推理,和一个更大的张量加速器带来高达4.35倍的AI性能提升。第二代骁龙8也是首个支持变革性的INT4 AI精度格式的骁龙移动平台,在持续AI推理方面能够实现60%的能效提升。
目前,搭载高通 AI 引擎的产品出货量已超过 20 亿,赋能极为广泛的终端品类,包括智能手机、XR、平板电脑、PC、安防摄像头、机器人和汽车等。
数量可观的生成式 AI 模型可从云端分流到终端上运行
也正基于终端侧AI算力的保障,才能实现本地运行Stable Diffusion的能力。在《混合AI是AI的未来》白皮书中第一部分中专门列出了不同生成式AI用例所对应的模型规模数量,从图表中就能发现,不少功能的模型参数在 10 亿至 100 亿之间,意味着完全可以在终端侧运行丰富的生成式 AI 功能,例如文字生成图像、组合优化、图像理解等。据Ziad Asghar透露,通过与合作伙伴的共同努力,普通用户将能在今年体验到如Stable Diffusion这样的终端侧用例。
与此同时,未来几个月内,高通将有望支持参数超过100亿的模型在终端侧运行。Ziad Asghar表示,这也将成为基于高通技术产品的一大差异化优势。
《混合AI是AI的未来》白皮书预计,在混合AI的助力下,智能手机将成为真正的数字助手。精准的终端侧用户画像与能够理解文字、语音、图像、视频和任何其他输入模态的大语言模型相结合,让用户可以自然地沟通,获取准确、贴切的回答。进行自然语言处理、 图像理解、视频理解、文本生成文本等任务的模型将面临高需求。
相比PC,智能手机自面世之初,就是一台体验为先的设备,所有对于跑分的执念也皆源于对于使用体验的一种数值预期。当AI开始接过智能手机继续发展的风向标,用户在购买新设备时,将开始逐渐将关注重点转移到AI算力与配套用例支持情况上,智能手机的需求瓶颈或许将迎刃而解。