Notebookcheck Logo

OpenAI 推出可根据文字提示生成逼真视频的人工智能模型 Sora

OpenAI 推出 Sora,提供逼真的文本到视频生成功能(来源:OpenAI)
OpenAI 推出 Sora,提供逼真的文本到视频生成功能(来源:OpenAI)
OpenAI 的最新项目 Sora 将文字提示无缝转化为栩栩如生的视频,为人工智能创新开辟了新天地。尽管存在一些小瑕疵,但 Sora 能够生成引人入胜的场景,从老式越野车在山间集结到动画怪兽,都展示了它在视觉叙事方面的潜力。目前,只有少数人可以使用该模型,他们正在对其安全性和风险进行测试,一些视觉艺术家和创作者也在对其进行早期反馈。
AI

OpenAI一直是消费人工智能领域的开拓者,为文本和图像生成带来了革命性的变化,这要归功于DALL-EChatGPT.现在,该公司又推出了最新产品Sora。该公司的目标是进军文本到视频生成领域,试图进一步推动人工智能创造力的发展。

Sora 能够制作长达一分钟的视频,并配有 "多个角色"、"细微动作 "和 "详细背景 "等复杂场景,所有这些都由用户提示驱动。结果令人惊叹地栩栩如生,展示了人工智能在视觉叙事方面不可否认的潜力。

在 OpenAI 提供的几个演示中,Sora 毫不费力地将提示变成了现实。从一辆老式越野车在山间穿梭,到一只毛茸茸的怪兽坐在融化的蜡烛旁的奇异场景,所生成的视频都与所提供的指令极为吻合。

不过,《Sora》也并非没有瑕疵。在某些情况下,会出现细微的不一致或不真实的动作,突出了需要改进的地方,例如在一个场景中,一只猫向它沉睡的主人要早餐。虽然整个场景的渲染令人信服,但敏锐的观察者可能会注意到,当主人从睡梦中醒来时,一些细微的动作偏离了现实。然而,与模型制作令人惊叹的视觉叙事的整体能力相比,这些缺陷就显得微不足道了。

其中一个突出的例子是在融化的蜡烛旁描绘了一个毛茸茸的怪物。结果看起来真是绚丽多彩,就像皮克斯电影中的场景一样。这些错综复杂的细节,如怪物皮毛的纹理,本来是很难渲染的,但 Sora 在处理复杂视觉元素方面的能力却得到了充分展示。

目前,"红队 "成员可以访问 Sora,他们的任务是评估其潜在风险和影响。此外,OpenAI 还在与视觉艺术家、设计师和电影制作人合作,收集反馈意见,以提高模型对内容创作者的整体实用性。随着 Sora 的不断完善和评估,它有望实现视频创作的民主化,为故事讲述者和创作者提供一个强大的工具,帮助他们实现自己的愿景。

在亚马逊购买三星Galaxy Book3 笔记本电脑

索拉生成的毛茸茸怪物动画视频剧照(来源:OpenAI)
索拉生成的毛茸茸怪物动画视频剧照(来源:OpenAI)
由 Sora 生成的老式 SUV 在山上拉力赛的视频截图(来源:OpenAI)
由 Sora 生成的老式 SUV 在山上拉力赛的视频截图(来源:OpenAI)
正如这张剧照所描绘的那样,索拉显然不是没有缺点的。请注意,这位女士的手臂在醒来时看起来完全不像她应该有的样子(来源:OpenAI)
正如这张剧照所描绘的那样,索拉显然不是没有缺点的。请注意,这位女士的手臂在醒来时看起来完全不像她应该有的样子(来源:OpenAI)

资料来源

Please share our article, every link counts!
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2024 02 > OpenAI 推出可根据文字提示生成逼真视频的人工智能模型 Sora
Sambit Saha, 2024-02-16 (Update: 2024-02-16)