Notebookcheck Logo

英伟达™(NVIDIA®)推出被称为 "虚拟 3D 打印机 "的 LATTE3D 文本到 3D 生成式人工智能模型

LATTE3D 可解读高度特定的文本提示,生成 3D 模型(图片来源:NVIDIA®(英伟达™)公司
LATTE3D 可解读高度特定的文本提示,生成 3D 模型(图片来源:NVIDIA®(英伟达™)公司
英伟达™(NVIDIA®)公司的人工智能研究团队发布了一种新的生成模型,它能在一秒钟内将文字提示转化为三维模型,可用于(或至少接近于)游戏开发、设计和机器人等应用。到目前为止,该模型只训练生成 "动物和日常物品",但还可以添加更多类别。这种近乎瞬时的速度应能改变许多工作流程。
AI 3D Printing Nvidia Virtual Reality (VR) / Augmented Reality (AR)

图像和视频生成人工智能模型的新闻报道已经持续了一段时间,而英伟达(NVIDIA)公司又在下一个合理的方向上迈出了一步,推出了 LATTE3D 这一新的生成人工智能模型,可在不到一秒钟的时间内将文字提示转化为完整的 3D 模型。在 英伟达™(NVIDIA®)GTC该技术被誉为类似于 "虚拟 3D 打印机",因为它可以 "以标准渲染应用的常用格式 "立即提供 3D 模型,随时部署到视频游戏开发、广告、设计项目或任何需要虚拟环境的应用中,包括 VR 和 AR.

文本到 3D 的生成式人工智能并不是一项新技术,英伟达公司的研究论文 本身就将 LATTE3D 与几个现有系统进行了比较,如MVDream3DTopiaLGM 。LATTE3D 的压倒性优势在于速度。在对比测试中,其他人工智能模型生成一个输出结果需要 20 秒到 30 分钟不等,而 LATTE3D 只需 400 毫秒就能生成一个与之相当(通常质量更高)的渲染结果。

LATTE3D 可分别处理 3D 几何图形和纹理,以创建逼真的模型(图片来源:NVIDIA)
LATTE3D 可分别处理 3D 几何图形和纹理,以创建逼真的模型(图片来源:NVIDIA)
近乎即时的输出是 LATTE3D 超越其他人工智能模型的优势所在(图片来源:NVIDIA)
近乎即时的输出是 LATTE3D 超越其他人工智能模型的优势所在(图片来源:NVIDIA)
在更多时间内,LATTE3D 会进一步完善输出结果(图片来源:NVIDIA)
在更多时间内,LATTE3D 会进一步完善输出结果(图片来源:NVIDIA)

值得注意的是,与三维打印一样,LATTE3D 和其他人工智能模型的输出质量也会随着时间的推移而提高。这样做的好处是,与三维打印不同,一开始可以选择速度优先于质量,之后再决定等待更精细的输出,而不是从一开始就固定设置。

与其他生成式人工智能一样,LATTE3D 有可能改变许多工作流程。以前,要创建一个简单的对象,人们需要搜索三维资产库或花费宝贵的工时,而使用英伟达™(NVIDIA®)的技术,只需输入简单的描述,然后将生成的输出导入软件应用程序或平台即可。

LATTE3D 功能示例(图片来源:NVIDIA)
LATTE3D 功能示例(图片来源:NVIDIA)
 
 

到目前为止,研究团队只训练 LATTE3D 创建日常物体和动物模型,但如果有合适的数据集,还可以扩展到其他类别。该模型使用英伟达™(NVIDIA®)A100 Tensor Core GPU进行训练,在公司的演示中,该模型在单个英伟达™(NVIDIA®)RTX A6000上运行。

作为一个研究项目,LATTE3D 仍在开发中,迄今为止还没有将其作为产品或服务发布的消息。该项目的未来计划包括将功能扩展到 "文本到 4D",或生成 3D 动画。

使用Meta Quest 3 头戴式耳机XREAL Air 2 Pro AR 眼镜探索身临其境的虚拟和混合现实环境,这两款产品均在亚马逊有售。

资料来源

Please share our article, every link counts!
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 03 > 英伟达™(NVIDIA®)推出被称为 "虚拟 3D 打印机 "的 LATTE3D 文本到 3D 生成式人工智能模型
Vishal Bhardwaj, 2024-03-25 (Update: 2024-03-25)