Notebookcheck Logo

谷歌研究人员推出的人工智能 "精灵 "知道如何根据示例图像创建迷你游戏场景

谷歌精灵人工智能可以通过一张输入图像创建一个可玩的迷你游戏场景。(资料来源:人工智能生成的图像 Dall-E 3)
谷歌精灵人工智能可以通过一张输入图像创建一个可玩的迷你游戏场景。(资料来源:人工智能生成的图像 Dall-E 3)
谷歌 DeepMind 研究人员推出了世界上首个生成式交互环境人工智能--"精灵"。这种人工智能可以查看一个二维平台游戏示例的图像,然后创建一个可玩的迷你游戏场景。人工智能不需要额外的输入就能做到这一点。
AI Gaming

谷歌 DeepMind 的研究人员发布了世界上首个生成式交互环境人工智能 Genie。该人工智能可以在查看示例游戏图像后创建一个可玩场景。这为游戏玩家无需编程就能创建可玩的游戏打开了大门。

精灵是通过观察 30,000 小时的视频(680 万个 16 秒的片段)来训练 2D 平台游戏玩法的。人工智能将看到的视频图像和动作简化为一组数字,就像人类用文字描述游戏场景一样。

经过训练后,只需一个游戏场景的例子,精灵就能创建一个可玩的迷你场景。在幕后,人工智能可以使用复杂的方法扩展起始图像,生成图像的缺失部分,因此精灵可以随着玩家的前进绘制游戏世界的新部分。为此,它可以参考自己看过的数百万个片段,同时赋予角色可玩的动作,如奔跑或跳跃。

重要的是,精灵通过观察游戏来学习动作,而不是由人类来指出。因此,当一座桥上有缝隙时,人工智能就会根据它所看到的,知道角色可能需要跳过缝隙,当人类玩家按下控制器上的向上按钮时,它就会跳过缝隙。

这一切都需要巨大的计算能力来进行训练(在拥有数百个芯片的计算机上,数周内需要数千兆兆次的运算)和游戏,而人工智能只能以每秒 1 帧的超慢速度进行游戏。

对于有技术头脑的人来说,视频帧和推断出的潜在动作是利用van den Oord 的 VQ-VAE 进行标记的。.用户指定的潜在动作和标记化视频帧通过Chang 的 MaskGIT 变换器输入动态模型,生成迭代帧标记。生成迭代帧标记,然后利用Gupta 的 MaskViT 生成输出视频。.在整个过程中,我们采用了 Xu在整个过程中,除了空间注意力外,还使用了时间注意力,以提高预测效果并减少内存需求。

因此,在计算机强大到足以完全独立制作 2D 平台游戏的那一天到来之前,请使用掌上游戏机(如亚马逊上的这款游戏机)享受经典平台游戏的乐趣。

Google Genie 可根据示例图像或图纸创建可播放场景。更多示例请参见 Genie 网站。(来源:谷歌 DeepMind)
Google Genie 可根据示例图像或图纸创建可播放场景。更多示例请参见 Genie 网站。(来源:谷歌 DeepMind)
Please share our article, every link counts!
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 03 > 谷歌研究人员推出的人工智能 "精灵 "知道如何根据示例图像创建迷你游戏场景
David Chien, 2024-03- 6 (Update: 2024-03- 6)