12月以来,OpenAI公司的一款新型聊天机器人ChatGPT在互联网上掀起轩然大波。它可以迅速写出诗歌、剧本和具有一定篇幅的答案,推特上充斥着目瞪口呆的技术专家发布的这类作品的截图。尽管GPT3的底层技术已经问世多年,但这却是OpenAI首次将这个高性能的语言生成系统提供给大众使用,并在人们中间引发了一场向该系统发出最有创意指令的竞赛。(我最偏爱的指令是“写一段圣经经文,解释如何把花生酱三明治从录像机里取出来。”)除了这些噱头之外,有人已经发现了ChatGPT的实际用途,包括程序员可以用它起草代码或查错。然而,该系统的最大用途可能给谷歌(94.86, -0.60, -0.63%)带来经济灾难,因为它可以为我们目前在世界最强大搜索引擎上查询的问题给出更好的答案。
谷歌的工作原理是抓取数十亿个网页,对内容进行索引,再将最具相关性的答案进行排序。然后给出一个可供点击浏览的链接列表。ChatGPT则为困惑的互联网用户提供了他们更感兴趣的东西:基于自身搜索和综合性信息给出的单一答案。ChatGPT已经在数百万个网站上进行了训练,不但可以收集进行类似人类对话的技能,还可以收集信息本身,只要信息是2021年底前发布到互联网上的。
过去一个月,我找到了自己以往在谷歌上的搜索信息,将其中18个查询内容输入ChatGPT,再把它们记录下来。然后回过头,再用谷歌查询,重新唤起我的记忆。在我看来,最终结果是,18个查询当中,ChapGPT有13个答案比谷歌更有用。
“有用”当然具有主观性。这个词的含义是什么?在本例当中,指的是答案清晰全面。ChatGPT在关于“炼乳和淡奶哪个更适合做感恩节南瓜派”的问题上给出了详细(尽管也略显冗长的)回答,解释了炼乳可以让南瓜派更甜。(当然,这样更好。)谷歌主要提供了一个食谱链接的列表,必须点开才能查看,而且没有明确答案。
这完全彰显了ChatGPT对谷歌的主要威胁。它给出了单一的即时回应,无需进一步搜寻其他网站。用硅谷的话说,这是一种“无摩擦”体验,是在网上消费者一边倒地青睐快捷易用服务之际的一种类似“圣杯”的东西。
当然,对于一些查询内容,谷歌确实有自己的归纳性答案,但只是排名最靠前网页的汇总,通常也很简短。谷歌也有自己的专有语言模型,名为LaMDA,性能优异,以至于该公司的一位工程师认为这个系统拥有自主意识。
那么,谷歌为什么不像ChatGPT那样,针对查询生成自己的单一答案呢?原因在于,任何阻止用户翻找搜索结果的东西都会损害谷歌的可以促使人们点击广告的事务性业务模式。数据显示,2021年,Alphabet公司2576亿美元的收入中约81%来自广告,这其中大部分是谷歌的按点击付费广告。
“这的确是一种更好的体验,”他补充说,“谷歌搜索的目标是让你点击链接,最好是点广告,页面上的所有其他文本都只是用来凑数的东西。”2019年,拉马斯瓦米与他人联合创建了名为Neeva的订阅式搜索引擎,并准备在未来几个月内推出该引擎自己的生成式搜索功能,可以对网页进行归纳总结并添加脚注。
ChatGPT不显示其信息来源。事实上,它的创造者们很可能不知道它是如何生成答案的。这揭示了它的最大弱点之一:有时候,它给出的答案是完全错误的。
12月5日,面向程序员的问答网站Stack Overflow暂时关闭了平台用户分享ChatGPT建议的功能,称程序员利用该系统上传的数千条答案经常是错误的。
我本人的经历可以做证。当我把12岁女儿的英语作文题输入系统时,它给出了一篇冗长、雄辩的分析,听起来言之凿凿。但答案中错误连连,比如它称一位文人的父母早已过世,而实际上他们还活着。
关于这个缺陷,最令人不安的是不准确的地方难以察觉,尤其是当ChatGPT听上去信心十足的时候。Stack Overflow网站称,该系统给出的答案“通常看上去很完美”。OpenAI自己也承认,这些建议往往貌似可信。开始的时候,OpenAI是想把它的系统训练得更为谨慎,但结果却是,它拒绝回答它知道答案的问题。它反其道而行,给出的答案就像是某位不学无术的大学兄弟会成员用来蒙混过关的论文。胡言乱语还流利顺畅。
目前还不清楚ChatGPT的错误有多大的普遍性。推特上流传的一项估计是2%到5%。或许更多。这将使互联网用户对利用ChatGPT获取重要信息持慎重态度。谷歌还有一个优势:它主要通过对产品的事务性搜索查询和对其他网站的导航式搜索(比如有人会键入“Facebook”或“YouTube”)来赚取收入。谷歌2022年的前100名搜索查询中,这类查询占据了多数。只要ChatGPT不提供其他网站的链接,就不会太深入地侵占谷歌的地盘。
但这两个问题会随时间推移而演变。随着OpenAI将其模型的训练内容扩展到更接近当前的时间段,ChatGPT的准确度可能提高。为此,OpenAI正在开发一个名为WebGPT的系统,希望能针对搜索查询提供更准确的答案,其中也将包括对信息来源的引用。ChatGPT和WebGPT的搭配使用,可能是对谷歌的有效替代方案。ChatGPT答案的准确性已经高于OpenAI早期的系统了。
ChatGPT五天内就聚集了100万用户。这是非凡的成就:Instagram用两个半月才达到这个数字,Facebook用了10个月。对于其未来应用,OpenAI并没有公开给出推测,但如果它的新聊天机器人开始分享其他网站的链接,尤其是那些售卖商品的网站链接,就可能给谷歌带来真正的危险。