Notebookcheck Logo

现代 LLM vs 1970 年代 Atari:双子座承认无法获胜,退出比赛

以纯白背景拍摄的复古电子游戏机 Atari 2600。(图片来源:维基共享资源上的 Evan-Amos)
古老的 Atari 2600 在国际象棋中击败了另一位强大的竞争者。(图片来源:Evan-Amos on Wikimedia Commons)
在击败 ChatGPT 和 Microsoft Copilot 之后,复古的 Atari 2600 在与 Google 的 Gemini 的较量中不费吹灰之力就取得了胜利。
AI Microsoft Gaming Retro

据报道,谷歌的 "双子座 "聊天机器人在得知雅达利 2600 老式游戏机已经搞垮了 ChatGPT 和微软 Copilot 之后,拒绝与雅达利 2600 下棋。

基础架构架构师罗伯特-卡鲁索(Robert Caruso)告诉《注册》(The Register),,这个问题让他很感兴趣。因为 "ChatGPT 和 Copilot 是建立在相同 OpenAI 基础上的表兄弟,而 Gemini 则是完全不同的野兽"。

Caruso 之前曾让 Atari 2600 与 ChatGPT 对战,后者只有微不足道的 1.19 MHz 8 位处理器和高达 128 字节的内存,结果非常有趣。

在击败 ChatGPT 之后,Atari 2600 又迎战微软的 Copilot,结果大致相同。有趣的是,在这两种情况下,人工智能聊天机器人似乎都有一种错位的自信感,并吹嘘自己在国际象棋方面的实力。

谷歌的 "双子座 "也是这么做的。不过,当卡鲁索告诉聊天机器人雅达利 2600 之前的对战时,聊天机器人似乎又反悔了,承认自己 "对国际象棋的威力产生了幻觉",表现出了人工智能罕见的内部技能评估意识。

双子座随后决定 "取消比赛可能是最省时、最明智的决定"。卡鲁索说,"双子座 "发现自身不足的能力给他留下了深刻印象。

"增加这些现实检查不仅仅是为了避免有趣的国际象棋失误。它是为了让人工智能更加可靠、可信和安全--尤其是在一些关键的地方,因为在这些地方,错误可能会带来真正的后果,"Caruso 告诉 The Register。

资料来源

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 07 > 现代 LLM vs 1970 年代 Atari:双子座承认无法获胜,退出比赛
Rohith Bhaskar, 2025-07-15 (Update: 2025-07-15)