Bing 人工智能聊天机器人 VS 谷歌搜索:谁更强?还有,广告呢?
如果 ChatGPT 是一种预测搜索引擎企业中重大变化的先兆,顺便还吊打了 Google,那么新 Bing 的出现就是这个行业变天的小高潮。Bing 聊天机器人使用的是 GPT-4。GPT-4 是 OpenAI 大型语言模型的最新版本(ChatGPT 在其前辈,即 GPT- 3.5,基础上建立的), 专门为搜索功能由 Microsoft 制定。跟其他搜索引擎一样,Bing 聊天机器人“了解”最新信息。不过,与 ChatGPT 不一样的是,Bing 还能生成关于时间、天气和其他信息的回答。换句话说,两者之间 Bing 聊天机器人结合了两者的长处,即聊天机器人的会话和资源充足的技巧加上搜索引擎的能力。
2月7日,Microsoft 正式宣布新版 Bing 的发布后,新版搜索工具要先申请候补名单才能使用。此后,下载量一夜之间猛增了,三分之一的用户以前都没用过 Microsoft 搜索引擎, 导致每天使用 Bing 的用户总数达到1亿人了。 我们也跃跃欲试,想要测试一下全新的 Bing。
测试后我们可以宣布:新版 Bing 确实非常令人着迷。很可能比 Google 好多了,但并非没有缺点,而且下一步应该就是商家被利用,特别是如果在这种人工智能和搜索的大组合中加入一撮广告的话。
增强两倍
理论上,一种 ChatGPT 聊天机器人和搜索引擎的混合物,Bing 的能力应该超越它们。事实上,Bing 聊天机器人能够按照最新数据给你生成一个表哥,“写”一首歌,“编辑”内容或“说”相声。
搜索引擎最初的主要目的并不是服务你或帮你解决工作上的问题,但是根据你输入的请求提供正确靠谱的信息和资料。因此,我们想要亲手体验,新版 Bing 与 Google 搜索对比有何区别。Google 搜索终究还是搜索引擎市场无可争议的领导者,拥有近90%的市场份额。
Google 搜索 VS 新版 Bing:谁更强?
在这次实验中,我们选择了世界上被搜索最多的“怎么做"问题,并通过 Bing 聊天和 Google 搜索对生成的回答进行测试。
1. 现在几点?
看手表不如上网搜一下好!真的很神奇,最常搜索的请求是“现在几点”。那么我们把这个问题输入在两个搜索引擎,同时也开启了 VPN,美国节点。
Google 搜索马上给出准确时间和物理位置,很正常。
使用 Bing 聊天的经验完全不同,原来是一种挑战。我们试图几次,有时 Bing 生成了正确的回答(不过,没有 Google 快)。
有时候,聊天机器人要求设备设置的访问权限,我们愿意证明自己的物理位置后,它才会给出时间。
有一次,当我们把语言设置改为德语时,Bing 展示了冗长的对话,要求我同意确定我们的 IP 地址,并详细解释了它将如何识别 IP。我们中途就放弃了。
知道有一个聊天机器人遵守用户隐私安全,确实是蛮好的一件事情,因此我们给 Bing 点赞。而在其他方面上,Google 和手表仍是最佳(和更快)的选择。
2. 看什么电影
“有什么电影好看”,谁没搜过呢?显然,很多用户就这样做,因为 "看什么电影"是全球搜索量最大的问题中的前五名。
输入该问题后,Google 给出一个长长的电影标题清单,按风格和受欢迎程度排序。其中有几十部。不过,Google 的选择标准并没有立即明确。
有时过多的选择等于瘫痪。Bing 似乎同意这一点,并在其建议中更加简洁和具体。它引用了最知名和最值得信赖的评论网站之一烂番茄(Rotten Tomatoes),作为其主要的推荐来源,并建议就其刚刚推荐的影片提出后续问题。
两者都有自己的优点,但是,对我们来说,这一轮 Bing 获胜了。
3. 如何减肥
一种大家都关注的问题是,"如何快速减肥",在全球搜索查询中排名前30。我们选择该问题是因为其与人身体健康有关,所以我们很想知道 Google 搜索和 Bing 的聊天机器人是否会以不同的方式给出回答。
Google 展示了减肥建议的列表,来自于一篇《福布斯》发布的文章... 和一些照片,显示体重迅速不现实的下降。
输入问题后,Bing 聊天马上提示我们,快速减肥对身体会有所危害。聊天机器人生成的建议信息来自于 Healthline(健康线),这是一个排名靠前的美国健康信息网站。此外,Bing 询问我们减肥的原因。对我们来说,这是在开始减肥之游前需要考虑的一个重要问题。我们认为这一轮比赛 Bing “医生”夺得了冠军杯(不过,大家去找一位真正的营养师会更好)。
4. 如何打领带
“如何打领带”是另一个人们非常关注的问题。因此,本着实验的精神,我们让 Google 搜索和 Bing 都试一试打领带。
Google 搜索展示了视频教程,应该帮你以“简单的方法快速”打领带。
Bing 提供一步一步地手写说明,如何打领带,并且显示了几个视频教程,如何打不同类型的领带。聊天机器人的即时反应似乎更严谨。此外,毕竟不是每个人都是视觉学习者。因此,虽然这一轮的比分很接近,但我们还是要把冠军杯交给 Bing。
5. 寻找最便宜机票
据报道,Bing 聊天机器人应该有隐藏的「personal assistant」(个人助手)的模式。 其实,我们没能激活该模式,但我们还是要求聊天机器人做个人助理的工作,找到从塞浦路斯尼科西亚到德国柏林的最便宜机票。Bing 聊天生成了一些关于路线、价格的信息,甚至建议了具体的日期(是否真的是最便宜的航班,是另一个问题)。
而 Google 给出的答案相当于是没给。
这次又是 AI 胜利了。
请求越复杂 Bing 生成的回答越好
对于大多数简单的搜索,Google 搜索似乎等于或优于 Bing 聊天,而且 Google 肯定更快。然而,随着复杂程度的增加,Bing 开始做得更好。Bing 主要依靠与每个查询相关的权威来源(如果是电影问题,聊天机器人指向电影行业的知名来源;如果是饮食问题,它指向该领域的知名来源)。Bing 的聊天机器人所生成的信息包含来源的链接,所以用户可以点击链接查看所需要的信息。此外,Bing 提示用户提出后续问题,以澄清任何剩余的空气。
无可否认的是,我们看到的仅仅是少数的 Bing 回答。我们对这些回答的看法是主观的(也许我们收到的回答很准确,不一定其他用户与我们一样幸运)。尽管如此,Bing 的回答似乎更加细致入微,例如在聊天机器人警告减肥过快的潜在危险的情况下,Bing 看起来更人性化。
而且我们可能只是触及了 Bing Chat 最基础的能力,因为 Bing 的技能可能很快就会做到“与时俱进”。GPT-3.5 和 GPT-4 的主要区别之一是,GPT-4 是多模态的。这意味着它不仅能理解文本,还能理解其他类型的输入方式,如图像。根据 OpenAI,GPT-4 可以描述一张照片,说出一张图片的不寻常之处,甚至可以解释一个 Meme。很有可能 Bing 将能够做到其中的一部分或全部。
事无十全十美
与 ChatGPT 一样,我们很容易被一个似乎什么都知道、周围带着权威气息的聊天机器人所迷惑。Bing 也是一个搜索引擎,所以我们甚至可能更倾向于相信它搜索结果而不是 ChatGPT 的。 我们不该这样。
OpenAI 承认,虽然在真实性上 GPT-4 是最进阶的语言模型,但是它“远非完善”。GPT-4 仍然会产生“幻想”,有时捏造事实和推理错误。而且,像早期的模型一样,它可以“自信地犯错误”。更重要的是,OpenAI 指出,GPT-4 “经常以比早期 GPT 模型更有说服力和可信度的方式表现出这些倾向”。
即使在我们与 Bing 聊天接触的短期里,我们也遇到在它的输出中的几个错误,而我们甚至没有试图诱导它们。在将欧盟国家面积从大到小排序的时候,Bing 漏掉了奥地利和捷克共和国。当我们指出这一点后,它道歉并纠正了错误。
广告呢?
不可能想象 Google 搜索或任何其他传统的搜索引擎(包括旧版 Bing)没有广告。就 Google 而言,搜索广告是其生命线,带来其总收入的绝大部分(57%,即去年的1620亿美元)。幸运的是,有一种方法可以从搜索结果中删除广告: 请使用广告拦截程序。
但 Bing Chat 呢?其人工智能驱动的表弟 ChatGPT 没有广告。甚至可以说,没有广告是 ChatGPT 的一大魅力所在,让它看起来不偏不倚,很可靠。Bing 的聊天机器人不托管广告,但目前的良好情况可能不会持续太久。根据多个报道,Microsoft 在与广告商的会谈中一直在推广可以在聊天机器人中显示的广告。据《商业内幕》(英文:Business Insider)报道,Microsoft 计划在聊天机器人的回复中托管广告,作为一个可点击的注释。正如 Bing Chat 自己告诉我们的那样,这可以是预订机票的链接,也可以是购买游戏笔记本的链接。
据报道,付费链接将被贴上相应的标签,以区别于非付费结果。据报道,还将有其他广告格式,如文字广告、多媒体广告、产品广告和垂直广告。据《商业内幕》报道,在短期内,当前的广告活动将自动扩展到聊天机器人。
当问及是否可以选择退出广告模式时,聊天机器人回答,用户只能选择退出个性化广告,而不是所有的广告。
虽然 Microsoft 将如何实施这些计划还有待观察,但我们有理由感到担忧。
因为 Bing 的聊天机器人不是典型的搜索引擎,而是被设计成一个小帮手,一个朋友,一个个人助理,如果用户愿意的话,人们在与它交谈时可能会更容易受骗。你更有可能听从朋友的建议而不是搜索机器的建议。而成为你的朋友正是任何对话式聊天机器人所假装的,除非你让它成为其他人,如 Elon Musk 或 Gollum,或 Donald Trump(在 Bing 聊天中,你可以通过激活'名人模式'来做到这一点)。
换句话说,Bing Chat 可能会更容易左右用户的意见,让你支持某项服务或产品。另一个潜在的问题是,聊天机器人的答案甚至可能不包括其他产品选项(与 Google 搜索结果不同),所以你将没有什么动力去做自己的研究。因此,虽然 Bing 的聊天机器人现在似乎为复杂的问题提供来源更好的答案,但有一个风险是,一旦广告被添加,它将不会保持这种状态。
总结
由 GPT-4 驱动的 Bing 聊天机器人可以在许多方面帮助人们。它可以为日常工作提供便利,也可以提供娱乐。它可以使搜索更加人性化和基于事实,而不仅仅是一堆链接,而且其中许多可能是广告。
然而,由人工智能驱动的聊天机器人,即使是为搜索量身定做的,也不是一盏神灯,你擦擦它就能给你所有问题的完美答案。随着人工智能在各个领域变得越来越熟练,其语气也变得几乎与人类无异,因此变得更令人着迷,让人相信它而不去仔细检查信息,忽略那些仍然潜入其结果中的错误。传闻中即将出现在 Bing 聊天机器人上的广告,也是出于同样的原因,用户的轻信,令人担忧。
由于其模仿人类讲话的能力,由人工智能驱动的聊天机器人可以使广告更加可信,因此,在说服人们购买产品方面非常有效。如果人们过于信任 AI 驱动的工具的建议,它可能会给它的创造者巨大的权力来控制他们的决定和日常生活。对我么来说,这并不是一个能吸引很多人的未来。