2023年,ChatGPT(微软投资的Open AI公司研发的聊天机器人)“横空出世”,其强大的语言理解和文本生成能力迅速引发市场热议,一时间,“我们正处于AI的‘iPhone时刻’”、“2023年有望成为AI领域最令人兴奋的一年”、“我们正迎来新一轮技术革命”等声音此起彼伏。比这些论调更具力量的是,目前,包括百度、腾讯、阿里、华为、京东、360等多家国内科技巨头均已布局以ChatGPT为代表的生成式AI(AIGC)工具领域,小米创始人雷军日前也公开表态,将全力以赴、坚决拥抱AI大模型(ChatGPT、生成式AI本质上都是基于AI大模型的一些应用)。
证券时报记者多方采访发现,生成式AI或引发新一轮技术革新,未来生成式AI可能成为新的入口或是一个新的操作系统,让“AI+”模式可以广泛应用于各行各业,对传统的商业模式进行革新。但由于仍处于发展初期,生成式AI目前同样面临多重挑战,如准确度不足、人工智能人才技能缺失、数据安全与隐私、版权问题、大规模商业化应用仍有很长一段路要走等。
AI进入大模型时代
生成式AI即通过各种机器学习方法,从数据中学习对象的组件,进而生成全新的、完全原创的内容,如文字、图片、视频等,其与此前普通AI最大的区别在于,生成式AI是基于人工智能大模型。“大”就要求其背后拥有非常庞大的算力和存储能力,正因如此,生成式AI未来才有可能成为各行各业接入AI的一个软件接口或底层操作系统,实现AI技术与业务的深度融合。
据了解,谷歌最早在全球发布AI大模型,之后或因为整体解决方案、成本、技术成熟度等原因,没有在市场广泛推广,直到最近才进入大众视野,而大模型在中国走向市场则从2021年开始。
作为国际权威研究机构IDC的研究总监,卢言霞主要负责人工智能与大数据领域的研究。近日她在接受证券时报记者采访时表示,厂商宣传中常提到千亿级、万亿级参数为大模型、超大模型,实际在产业落地阶段,一般具有三个特征:一是预训练模型学习过海量数据(21.050, 0.31, 1.49%)(维权),二是用户端模型二次开发仅需少量数据,三是相比上一代的算法模型有更高的预测准确度。
目前,整个生成式AI市场大模型日益丰富,既有全球早期包括谷歌、Open AI及脸书等推出的大模型,也有中国市场前几年就在耕耘的华为的盘古大模型、百度的文心一言,以及腾讯发布的混元、阿里发布的大模型等等。
近日,知乎、360、京东等国内科技企业也均已卷入生成式AI之战,小米创始人雷军近日表示,将坚决拥抱AI大模型。
“基于大模型的升级,发现巨量参数计算之下,生成式AI出现了能力涌现的现象,反映为AI具备了一定的类似人类的理解能力和推理能力,而在绘画、语言文字等方面的能力出现了跨越式发展,基于生成式AI进行应用型产品研发,可以大幅提高人工智能服务质量,进一步提高工效、降低成本,这是企业争相进军生成式AI的主要原因。”萨摩耶云科技集团首席经济学家郑磊对证券时报记者表示,目前大模型开发成本仍非常高,只有实力非常雄厚的企业才有能力涉足,中国企业这方面投入存在瓶颈问题。
“ChatGPT、大模型、生成式AI是当前三大人工智能热点,ChatGPT、生成式AI都是基于大模型的应用,过去的人工智能主要涉及机器学习,未来有可能所有的AI应用场景会采用大模型的AI进行升级。”卢言霞说。
将加速各行各业AI化
有关生成式AI对行业的影响,英伟达创始人兼CEO黄仁勋称人工智能“iPhone时刻”已经到来。
对此,IDC中国副总裁兼首席分析师武连峰表示认同:“ChatGPT的出现,实现了与消费者的自然对话,生成式AI五年或十年以后有可能相当于iPhone对移动互联网产生的影响。”
武连峰告诉证券时报记者,任何一个新技术对市场的影响无非三大层面:一是创造新商业模式、产品或者服务;二是改造传统行业,降本增效;三是颠覆传统行业。
“生成式AI的核心是技术和业务深度融合,从量变发展到质变,我认为生成式AI,可能成为新的入口或者是操作系统。”武连峰举例说,Notion是一款笔记程序,以前没有ChatGPT的时候,它主要是做笔记的功能,但接入ChatGPT后,可以直接让它帮助列演讲提纲,将AI、笔记功能完美结合在一块了。
另外,在武连峰看来,生成式AI另一个方向往Open AI安装插件,类似于微信小程序,现在有十几个插件。ChatGPT如果变成用户对话入口,并装上插件,用户采用自然语言对话,就可以完成所有功能,包括支付、打车、定餐,统统集成进去。
“因此,生成式AI可能变成一个新的入口或者操作系统,ChatGPT的核心是生成式AI。”武连峰表示。
据了解,操作系统下接硬件,上接应用,如果生成式AI都能像基础操作系统或成为一个软件接口,那么各行各业的应用开发者都可以根据自己需要选择适配生成式AI所具备的参数,再通过后期训练以及代码优化、加工等,封装成市场化应用产品,这样的程序开发既简单又高效,且不再需要做AI那部分程序开发,就能自动接入生成式AI所具备的AI能力。
郑磊对记者表示,生成式AI的应用型开发远比大模型基础开发更简单,更依赖企业在特定产业积累的专业技能,成本较低,效益明显,而且投入资金可以根据研发产品的目标进行弹性调整,也适合中小企业参与。
“未来是不是所有的AI应用都可能是类似低代码的形式?短期之内AI与现有的企业级应用共存,未来有望完全改写数字化的市场甚至整个企业级构造一个全新的操作系统。”卢言霞告诉记者。
中国工程院院士、未来移动通信论坛理事长邬贺铨表示,人工智能(AI)已经从判别式发展到生成式,他介绍,百度“文心一言”大模型+飞桨深度学习框架已与600家行业客户合作打造了11个行业大模型,与吉利汽车合作构建了智能客服知识库、汽车领域知识库等,节省了75%的研发人力成本。
长城证券(8.480, -0.05, -0.59%)首席分析师蒋飞表示,“AI+”模式或将迅速扩展到各行各业,对传统行业进行新一轮升级,提升全社会的生产率,对经济产生深远影响。
大模型将行业化、垂直化
值得一提的是,尽管当前国内仍处于AI大模型发展初期,国内科技巨头也蜂拥推出相关大模型,但长远来看,多位业内人士认为,深耕行业、垂直领域的大模型将更具发展潜力。
“现在大家都在讲大模型,未来可能在国内大家会更多讲行业的大模型。但是光有这个模型我觉得是不够的,未来我认为反而是在行业大模型里面真正能够有高质量业务数据的公司可能会在这个行业或者说在利用大模型的未来发展上会有更大的发展潜力。”IDC中国助理研究总监崔凯对记者表示。
事实上,国内已有企业明确表示将瞄准专业大模型领域。
“在教育、医疗等专业领域的模型成效不比千亿级模型差。”近日举行的科大讯飞(61.170, 2.41, 4.10%)业绩说明会上,科大讯飞董事长刘庆峰表示,超大规模的大模型现在已经到了一个临界点,下一个阶段将用更多专业的子模型来协同训练,获得更可靠的成效,科大讯飞的研发人员从去年底开始就持续着认知大模型的研发攻关,将在5月6日发布讯飞星火认知大模型,科大讯飞有信心在国内认知大模型中达到技术领先,同时在教育、医疗等行业中率先深度应用。他还指出科大讯飞下一阶段会通过数据和算力倍增计划,提升应用效果,并且会以API(应用程序接口)形式赋能开发者,一同推动产业变革。
事实上,华为的盘古大模型也更聚焦于工业端方面的应用。
据了解,盘古大模型包括NLP(自然语言处理)大模型、CV(机器视觉)大模型、科学计算大模型、多模态大模型、语音大模型等多个模型。2021年9月,华为云发布了盘古药物分析大模型;2022年6月,华为云发布了盘古矿山大模型;2022年11月,盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型同期亮相。
华为云AI领域首席科学家、国际欧亚科学院院士田奇表示,基于从小模型到大模型,过去10年内AI算法的算力需求提升了40万倍,未来大模型发展资金需求将会更高,技术门槛也会更高,市场可能向大公司集中,毕竟大模型开发和训练一次1200万美元,资本门槛变高。另外,人工智能与科学计算的交汇,工业、气象、能源、生物医学等众多领域都受到人工智能的深刻影响,华为大模型会重点做好行业应用。
田奇还表示,随着人工智能走进企业核心生产系统,将会创造出更大价值,预计2026年人工智能行业渗透率将达到20%。
深度科技研究院院长张孝荣在接受证券时报记者采访时表示,国内涉足生成式AI的企业大致可以分为三类,第一类是少数几家企业或科研机构,基于自身原有算法结合国外开源技术,进行研发,如BAT、华为和复旦大学;第二类是借助于国外开源算法模型进行训练,推出应用型产品,如360等;第三类则是大多数企业跟风蹭热点,没有实质性投入,因为生成式AI技术尚不成熟,无法大规模商业应用,企业跟风的主要目的大多是通过制造影响力,达到融资的目的。
“国内AIGC企业基本上都是依托自身的商业资源和技术沉淀推出的相关产品,各家企业在算法模型、训练数据、生态体系构建等方面差异很大,产品在细分领域或场景中各有所长,未来或将从同质化竞争逐步转向差异化竞争。”天使投资人、资深人工智能专家郭涛向记者表示。
武连峰也提到,生成式AI从C端破圈以后慢慢会往B端渗透,无论是垂直AI或未来的通用AI,接下来还可能向量子计算、元宇宙和web3.0进一步延伸。
机遇与挑战并存
回顾人工智能发展历程,独立国际策略研究员陈佳告诉记者,中国其实在人工智能领域起步是很早,并且在本轮生成式AI全球崛起之前曾经长期霸榜中文AI领域,如全球弱人工智能时代初期,华为与寒武纪(248.000, 5.00, 2.06%)一度成为全球AI芯片设计的前两强,而在全球弱人工智能末期,中资科企不断加大AI领域自研投入,并不断加大与国外企业交流合作,使得中国的人工智能产业链发展迅猛,期间中国还深度参与了当时的全球最尖端的人工智能DeepMind的研发过程,包括中国棋院在内等各行各业也对测试、评估和完善AlphaGO人工智能进一步迭代等。
“这些都为当下强AI时代中资科企能够快速推出对标GPT等尖端产品和自主创新大模型奠定了基础。”陈佳说,目前国内无论是产业链还是市场层级,真正有能力对标Open AI旗下ChatGPT这种最尖端的AI开发工具大类的中资科技企业数量仍非常稀少。
“ChatGPT已发展到ChatGPT-4了,我们国家的同类产品整体还处于ChatGPT-1阶段。”一位业内人士向证券时报记者透露。
谈及与Open AI差距,阿里方面也坦言,Open AI是目前全球大模型研究领域的引领者,ChatGPT是非常优秀的模式,通义千问目前还在不断学习和成长中。
从行业前景来看,前述卢言霞告诉记者,生成式AI主要分为文生文、文生图、文生视频三大类,其中文生文的应用目前会相对成熟广泛一些,如对话式功能、支持搜索和营销的场景,文生图主要应用在互娱和游戏场景中,包括影视渲染、美术设计的场景中辅助美术设计、美工等,“说实话文生图哪些应用场景能够落地,现在还是比较困惑的”。
至于文生视频,卢言霞说,文生视频目前还处于企业产品发展的路线当中,真正能够基于AI生成短视频和文生视频还是比较少。
整体来说,卢言霞认为,生成式AI最先落地的应用场景包括知识管理类的应用、对话式应用,这是ChatGPT、AIGC最先落地的场景,以及营销的应用、代码生成、设计类应用,这些多数属于生成式AI所带来的渐进式机会,生成式AI还将带来变革式机遇,即生成式AI生成代码或成为新的企业操作系统,这对于个人或行业影响都较大。
据研究机构Gartner预测,2030年,人机交互的生成式AI市场规模将超过万亿元。
不过,机遇面前依然存在挑战。卢言霞认为,未来大模型在创业包括应用方面存在一定门槛,一是需要海量的数据和算力的资源,涉及到投资很高;二是在短期之内能够真正在企业落地见到效果可能还需要一定的时间,她建议创业公司选择一些特定垂直的场景或与一些大型具备算力的厂商合作,在特定场景率先实现商业化,以此保证未来的可持续发展。
此外,在卢言霞看来,令人兴奋的生成式AI还隐藏着其他多重挑战,比如人才和技能缺乏、AI生成的内容版权不清、生成的内容准确度不足,以及生成式AI可能会增加身份盗窃、欺诈和造假等。
“当前生成式AI最大的挑战是如何完善算法模型,提高技术成熟度,以便于商业化应用,其次是努力做好相关工作以便于适应社会监管各种需求。”深度科技研究院院长张孝荣说。
天使投资人、资深人工智能专家郭涛也对记者表示,当前,生成式AI赛道尚处于早期发展阶段,存在算法模型不成熟、训练数据不足及偏差、成熟的商业应用场景较少、相关法律法规不健全及技术伦理挑战等突出问题,距离大规模商业化应用仍有很长一段路要走。
近日,国家网信办发布的《生成式人工智能服务管理办法(征求意见稿)》已出炉,这意味着国内生成式AI有望迎来首份监管发展文件,证券时报将持续关注生成式AI未来发展。