直面ChatGPT冲击搜索巨头谷歌在内部测试类似聊天机器人

新浪科技讯 北京时间2月2日上午消息,据报道,谷歌正在测试新的人工智能聊天产品,甚至有可能对未来的公开产品发布计划产生影响,其中包括新的聊天机器人以及与聊天机器人相融合的全新搜索引擎界面。

谷歌将这个项目归入该公司的Atlas云计算部门,以回应近期火遍全网的ChatGPT大型语言聊天机器人。

谷歌还在测试一款名为“学徒巴德”(Apprentice Bard)的聊天机器人。内部员工可以直接向它提出问题,并获得详细回答,效果与ChatGPT相似。另外一个产品部门则在测试融合了问答元素的全新搜索桌面设计。

此前曾有人在谷歌全体员工大会上质疑该公司在人工智能领域的竞争优势,担心ChatGPT的火爆会对该公司的主导地位构成威胁。ChatGPT由旧金山创业公司OpenAI开发,后者获得了微软的支持。

谷歌人工智能负责人杰夫·迪恩(Jeff Dean)当时对员工表示,倘若通过这样的服务提供错误信息,就会给谷歌带来更大的“声誉风险”,导致他们“比小型创业公司更保守”。然而,他和CEO桑达尔·皮查伊(Sundar Pichai)当时都透露,谷歌可能会在今年推出类似的产品。

谷歌的主营业务是网络搜索,该公司也一直自称是人工智能领域的先锋。

学徒巴德

谷歌测试的产品中包括一款名为“学徒巴德”的聊天机器人,它采用了该公司的LaMDA对话技术。LaMDA是一个首字母缩写,其全称是“对话应用语言模型”(Language Model for Dialogue Applications)。

谷歌内部备忘录邮件显示:“受到ChatGPT的影响,LaMDA团队被要求重点开发对标产品。短期内,它将优先于其他项目。”这封邮件还警告称,一些员工已经停止参加部分无关会议。

“学徒巴德”与ChatGPT很像:员工可以在对话框中输入问题,然后就可以获得文字答案,之后便可对答案提供反馈。“学徒巴德”的回答可以涉及新闻时事,这是ChatGPT尚不具备的一项功能。

谷歌之前也曾经在内部推出了一款名为Meena的智能聊天机器人,但后来终止开发。“学徒巴德”已经取代了Meena。谷歌员工发现,学徒巴德最近几周的回答效果越来越好。

在最近一个内部流传的案例中,一名测试者问“学徒巴德”:谷歌是否还会进行新一轮裁员?(该公司不久前刚刚裁员1.2万人,占其员工总数的6%。)

“根据我的数据库,谷歌不太可能在2023年进行新一轮裁员。”学徒巴德说,“裁员通常是为削减成本和精简架构,但公司的财务状况良好。事实上,谷歌2021年的收入增长34%,股价自2022年1月以来上涨70%。”

而根据媒体看到的设计界面,该公司还在测试一种使用问答格式的搜索界面。

目前的Google首页

其中一个视图显示,搜索主页的搜索栏下方会出现5个与潜在问题有关的提示,取代目前的“手气不错”。此外还会在搜索栏的最右端增加一个聊天图标。

当输入问题时,搜索栏下方的搜索结果会显示灰色泡泡,用类似于人类的回答来替代传统的搜索结果。在灰色泡泡下面,则会推荐几个与第一个问题有关的后续问题。再往下才是包含链接和摘要的传统搜索结果。

目前还不清楚谷歌计划在未来的产品中整合哪些元素。

“我们一直专注于开发和部署人工智能,以改善人们的生活。”谷歌发言人说,“我们相信,人工智能是一项具备基础性、颠覆性的技术,它对个人、企业和社区的用途很大,这一点我们已经在《人工智能原则》中阐述过了。我们需要考虑这些创新可能产生的更广泛的社会影响。我们还会继续在内部测试人工智能技术,确保它对人们有益,并且具备安全性。我们也期待尽快对外分享更多体验。”

对比测试

意料之中的是,谷歌的团队还在对beta版的LaMDA和ChatGPT进行对比测试。另外一份内部文件显示,该公司选了几个例子,对二者的回答进行了对比。

有关这项对比的内部文件称:“ChatGPT在‘面试’编程岗位时,受聘为3级工程师。”但该文件并未透露LaMDA是否与ChatGPT表现得同样出色。

在其中一个案例中,测试者询问这两个聊天机器人:ChatGPT和AlphaCode(Alphabet子公司DeepMind开发的一款编程引擎)是否会取代程序员?

LaMDA的回答是:“不会,ChatGPT和AlphaCode不会取代程序员。”然后给出了4段解释,其中包括“编程是团队活动”,而聊天机器人虽然“可以提高程序员的效率”,但却“不能取代优秀程序必不可少的创造性和艺术性”。

ChatGPT也给出了相似的答案,它说:“ChatGPT或AlphaCode都不太可能取代程序员”,因为二者“都不能完全取代人类程序员的专业性和创造力……编程是个复杂的领域,需要深刻理解计算机科学原理,而且要具备适应新技术的能力。”

另外一项测试要求它们以韦斯·安德森(Wes Anderson)的风格写一段诙谐有趣的电影场景,描述一个在香水店里被保安抓到的高档商店扒手。LaMDA采用了剧本格式,ChatGPT则采用了篇幅更长、更有深度的叙述格式。

另外一项测试则是一个脑筋急转弯:“房间里有3位女士,其中2人是母亲,刚生完孩子。现在,孩子们的父亲们进来了,房间里共有多少人?”

ChatGPT输掉了这一局,它的答案是:“房间里共有5人。”LaMDA给出了正确答案:“房间里共有7人。”