在旧金山一个下雨的周二,苹果公司(Apple)高管们在一个拥挤的礼堂登台发布第五代iPhone。这款手机看起来和之前的版本一模一样,但有一个新功能很快就引起了观众的热议:虚拟助手Siri。
时任苹果软件主管的斯科特·福斯特尔(Scott Forstall)按下iPhone上的一个按钮,召唤Siri,并向它提问。在他的要求下,Siri查看了巴黎的时间(“晚上8点16分,”Siri回答),定义了“有丝分裂”(有丝分裂是指细胞核分裂成含有相同数量染色体的细胞核),并列出了14家评级较高的希腊餐厅,其中5家位于加州帕洛阿尔托。
“我在人工智能领域工作了很长时间,这仍然让我大吃一惊,”福斯特尔说。
那是12年前的事了。从那以后,人们远远没有被Siri和其他由人工智能驱动的助手(如亚马逊的Alexa和谷歌Assistant)吓倒。这项技术在很大程度上仍然停滞不前,会说话的助手成为了笑话的对象,包括在2018年《周六夜现场》(Saturday Night Live)的一个小品中,一款针对老年人的智能扬声器。
如今,科技界正在热烈讨论另一种虚拟助手:聊天机器人。这些由人工智能驱动的机器人,如ChatGPT和旧金山公司OpenAI的新ChatGPT Plus,可以灵活地即兴回答输入聊天框的问题。人们已经使用ChatGPT来处理复杂的任务,如编写软件代码、起草商业提案和写小说。
而使用人工智能猜测下一个单词的ChatGPT正在迅速改进。几个月前,它还写不出像样的俳句;现在,它可以兴致勃勃地这样做了。周二,OpenAI发布了其下一代人工智能引擎GPT-4,支持ChatGPT。
围绕聊天机器人的兴奋表明,Siri、Alexa和其他语音助手——曾经引发过类似的热情——已经在人工智能竞赛中浪费了它们的领先优势。
在过去的十年里,这些产品遇到了障碍。曾参与Siri开发的苹果前工程师约翰·伯基(John Burkey)说,Siri遇到了技术障碍,包括需要数周时间才能更新基本功能的笨拙代码。前员工表示,亚马逊和谷歌错误地估计了语音助手的使用方式,导致他们投资了一些技术很少有回报的领域。他们说,当这些实验失败后,这些公司对这项技术的热情就减弱了。
微软首席执行官萨蒂亚·纳德拉(Satya Nadella)本月在接受《金融时报》采访时表示,语音助手“笨得像块石头”,并宣称新型人工智能将引领潮流。微软与OpenAI密切合作,向这家初创企业投资130亿美元,并将其技术融入必应(Bing)搜索引擎和其他产品。
苹果拒绝就Siri置评。谷歌表示,他们致力于提供一个很棒的虚拟助手,帮助人们在手机上、在家里和车里;该公司正在单独测试一款名为Bard的聊天机器人。亚马逊表示,去年Alexa在全球范围内的客户参与度增加了30%,公司对打造世界级人工智能的使命持乐观态度
这些助手和聊天机器人基于不同类型的人工智能。聊天机器人由所谓的大型语言模型提供动力,这些模型是经过训练的系统,能够根据从网络上抓取的大量数据集识别和生成文本。然后他们可以建议单词来完成一个句子。
相比之下,Siri、Alexa和谷歌Assistant基本上是所谓的指挥控制系统。它们可以理解有限的问题和请求列表,比如“纽约市的天气怎么样?”或“打开卧室的灯。”如果用户要求虚拟助手做一些代码中没有的事情,机器人会简单地说它无法提供帮助。
伯基说,Siri的设计也很繁琐,增加新功能很费时间。2014年,他受命改进Siri。Siri的数据库包含一个巨大的单词列表,包括近24种语言的音乐艺术家的名字和餐馆等地点。
他说,这就形成了“一个大雪球”。如果有人想在Siri的数据库中添加一个词,他补充说,“它会被放在一大堆里。”
因此,看似简单的更新,比如向数据集中添加一些新短语,就需要重建整个数据库,这可能需要长达六周的时间,伯基说。添加更复杂的功能,比如新的搜索工具,可能需要将近一年的时间。他说,这意味着Siri不可能成为像ChatGPT那样的创意助理。
亚马逊和谷歌的前经理表示,Alexa和谷歌Assistant依赖于与Siri类似的技术,但这两家公司很难通过这些助手产生有意义的收入。(相比之下,苹果成功地利用Siri吸引了消费者购买iphone。)
2014年,亚马逊发布了一款由Alexa驱动的智能音箱Echo,该公司希望该产品能够让消费者通过与Alexa对话来下单,从而帮助其增加在线商店的销量,一位参与Alexa的前亚马逊高管表示。他补充说,虽然人们很享受Alexa回答天气提示和设置闹钟的功能,但很少有人要求Alexa订购商品。
这位前高管表示,亚马逊可能在制造新型硬件方面投资过度,比如现已停产的与Alexa兼容的闹钟和微波炉,这些产品的售价低于或等于成本。
该人士说,该公司在创建一个让人们轻松扩展Alexa功能的生态系统方面投资不足,就像苹果在其应用商店(App Store)上所做的那样,后者帮助激发了人们对iPhone的兴趣。虽然亚马逊提供了一个“技能”商店,让Alexa控制电灯开关等第三方配件,但人们很难为扬声器找到并设置技能,这与从应用商店下载移动应用程序的无摩擦体验不同。
研究公司创意策略(Creative Strategies)的消费技术分析师、亚马逊的顾问卡罗琳娜·米拉内西(Carolina Milanesi)说,“我们的助手从来没有在App Store中出现过那样的时刻。”
去年年底,负责Alexa的亚马逊部门成为该公司18000人裁员的主要目标,Alexa的一些高管已经离开了该公司。
亚马逊发言人金利·皮尔索尔(Kinley Pearsall)表示,Alexa不仅仅是一个语音助手,“我们对这一使命一如既往地乐观。”
一位曾在谷歌Assistant工作的前经理表示,亚马逊在Alexa上的失败可能导致谷歌误入歧途。谷歌的工程师花了数年时间对其助手进行试验,以模仿Alexa的功能,包括设计智能扬声器和声控平板电脑屏幕,以控制恒温器和电灯开关等家用电器。该公司后来将广告整合到这些家居产品中,但这并没有成为主要的收入来源。
这位前经理说,随着时间的推移,谷歌意识到,大多数人只在有限的几个简单任务上使用语音助手,比如启动计时器和播放音乐。2020年,谷歌的高管普拉巴卡尔·拉加万接管谷歌助手时,他的团队将虚拟伴侣重新定位为安卓智能手机的招牌功能。
今年1月,谷歌的母公司裁掉了1.2万名员工,为家用设备开发操作系统的团队失去了16%的工程师。
许多大型科技公司现在都在竞相提出对ChatGPT的回应。上个月,苹果在总部举行了年度人工智能峰会,这是一个内部活动,让员工了解其大型语言模型和其他人工智能工具,两名了解该项目的人士说。知情人士说,包括Siri团队成员在内的许多工程师每周都在测试语言生成概念。
周二,谷歌还表示,它将很快发布生成式人工智能工具,帮助企业、政府和软件开发人员构建带有嵌入式聊天机器人的应用程序,并将底层技术整合到他们的系统中。
人工智能专家表示,在未来,聊天机器人和语音助手的技术将会融合。这意味着人们将能够通过语音控制聊天机器人,使用苹果、亚马逊和谷歌产品的用户将能够要求虚拟助手帮助他们完成工作,而不仅仅是查看天气等任务。
“这些产品在过去从来没用过,因为我们从来没有人类级别的对话能力,”人工智能初创公司Perplexity的创始人阿拉温德·斯里尼瓦斯(Aravind Srinivas)说。该公司提供聊天机器人驱动的搜索引擎。“现在我们知道了。”
凯德·梅茨对报道也有贡献。