Notebookcheck Logo

创建 AI 图像的速度快 30 倍将 Dall-E 3 和稳定扩散技术甩在身后

快 30 倍,但也不错:DMD。(图片:github/tianweiy)
快 30 倍,但也不错:DMD。(图片:github/tianweiy)
麻省理工学院的一个团队缩短了著名人工智能图像生成器的多阶段流程。这不仅缩短了生成成品图像所需的时间。所需的计算能力和功耗也同步降低。
AI Science

现在,大家对 Dall-E 或稳定扩散的魔力应该不陌生了。通过对场景、内容的简要描述,或许再加上一两句评论,一幅或多或少逼真的画面就会出现。幸运的是,这通常可以被识别为人工智能生成的作品,但它也能达到目的:我不必把一只狗放在冲浪板上或把一只狐狸穿上宇航服。只需点击几下,就能得到想要的图像。

然而,在后台,这是一个计算密集的过程,包括无数次迭代,不断重复算法,最终得到想要的图像。然而,麻省理工学院的研究人员成功地省去了这些繁多的中间步骤。取而代之的是,描述的场景只需一步即可创建。

这样,在大幅降低必要计算能力或等待时间的同时,还能获得类似的结果。同时,驱动 "分布匹配蒸馏(DMD)"系统所需的功率也更低。

更形象地说:用于训练的图像被分解成更粗糙的区域。这样就能根据拍摄对象确定大致的图像构成。此外,还要分析各种图像元素的概率,以便最终获得一个连贯的场景。

最终,详细信息和复杂性都会降低,图像生成器的速度也会随之加快。同样的硬件,每幅图像只需约 100 毫秒(三十分之一),而不是 2 至 3 秒。

如果你仔细观察图像,细节的减少是显而易见的。背景略显模糊,图像元素可能会重复出现。在某些情况下,图案看起来仍然会好很多,而且更容易被识别为人工智能的整体作品,或者至少是人工作品。另一个积极效果。

除了狐狸宇航员,还可以在找到 DMD 模型的许多其他示例。.

右侧的细节明显较少,但这并不影响图片的说服力。(截图:tianweiy.github.io)
右侧的细节明显较少,但这并不影响图片的说服力。(截图:tianweiy.github.io)

资料来源

Please share our article, every link counts!
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 03 > 创建 AI 图像的速度快 30 倍将 Dall-E 3 和稳定扩散技术甩在身后
Mario Petzold, 2024-03-25 (Update: 2024-03-25)