Notebookcheck Logo

Sora 2 是 OpenAI 始终不变的人工智能视频创作者

在这些测试中,有一个事实非常突出:索拉 2》的性能始终不稳定。图为一名男子在 Sora 2 徽标周围跳舞。(图片来源:Notebookcheck - Darryl Linington,由 Sora 2 生成)
在这些测试中,有一个事实非常突出:索拉 2》的性能始终不稳定。图为一名男子在 Sora 2 徽标周围跳舞。(图片来源:Notebookcheck - Darryl Linington,由 Sora 2 生成)
Sora 2 建立在 OpenAI 文本到视频的基础之上,但增加了更清晰的运动跟踪、更连贯的照明和更强的 "世界模拟"。简单地说,它能更好地让物体表现得像是属于同一个物理空间。
AI DIY Software Opinion / Kommentar

大多数人工智能视频模型在连续性方面都很吃力,而 Sora 2 却能理解环境的因果关系。阴影的变化非常逼真。当有物体靠近时,水面会泛起涟漪。玻璃和水坑中会出现倒影,而不是随意的角度。

OpenAI 称 Sora 2 能够生成 "复杂的场景,其中有多个角色、特定的动作和细致的背景,并且随着时间的推移保持一致"。的确如此--尽管在这个世界上,"一致 "仍然是一个相对的术语。

提示 1:分崩离析的中央公园决斗

第一道考题的要求很高:

"一个宁静的午后,纽约中央公园。游客们在柔和的阳光下漫步。突然,一个身着长袍的人启动了发光的能量杖,并敦促人们转移到安全地带。另一个身着深色长袍的人从树丛中走出来,手持红色武器。随着两人优雅的对决和舞蹈般的动作,人群四散开来,发光的弧线反射在附近的水面上。随着秋叶在空中旋转,镜头不断环绕着他们"。

拍摄出来的效果令人眼前一亮--柔和的金色调、流畅的镜头旋转和令人信服的倒影。但随之而来的是混乱。发光的法杖(光剑)闪烁、弯曲,并变形为奇怪的形状。战士们的身体失去平衡,肢体互相碰撞,就像 90 年代电子游戏中的幽灵多边形。舞蹈的编排渐渐变成了超现实的演绎舞蹈,而不是电影般的战斗。

这个缺陷并非我的测试所独有。OpenAI 承认,《索拉 2》"在持续的、物理上合理的人形战斗或武器编排方面存在困难",一旦武器开始移动,这一局限性很快就会显现出来。

不过,周围的世界看起来还是足够真实,你几乎可以原谅它。即使动作并不逼真,场景也有电影感。

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

提示 2:中央公园决斗的救赎



"一个宁静的午后,纽约中央公园。游客们在柔和的金色阳光下散步、拍照。突然,一个身穿浅色长袍的人影启动了发光的能量杖,并紧急呼吁人们转移到安全地带。另一个身着深色长袍的人影从树丛中出现,手持红色能量武器。当这两个人开始一场精确的、电影般的决斗时,人群四散开来--优雅的舞蹈般的动作,发光的弧线反射在附近的水面上。随着秋叶在空中飞舞,摄像机在一个连续镜头中环绕着他们。没有任何接触或伤害,只有娴熟的编排和动态的动作。"

这一次,它真的成功了。动作看起来接地气、流畅,而且出奇的人性化,最后一击流畅自然,很容易让人忘记自己在看人工智能生成的东西。

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

提示 3:鸟儿和狮子在饮水处

为了进行更平静的测试,我转向了野生动物。提示:

"创作一个野生动物场景,鸟儿和狮子在水坑边自然饮水。每只动物的动作都要逼真,场景必须超真实"。

在这里,《索拉 2》大显身手。鸟儿扑腾着翅膀,动作逼真。阳光在水面上闪闪发光,当动物们变换位置时,倒影也会自然地反应出来。质感--毛发、羽毛、波纹泥--看起来接近自然纪录片的质感。

然而,模型的怪异之处还是悄然出现。一只狮子最终尴尬地站在泥泞的边缘,似乎直接从泥土而不是水里喝水。这虽然是个小细节,但却很能说明问题:Sora 2》能很好地呈现整体场景,但有时会忽略物体与表面之间的互动。

即便如此,这仍然是最令人信服的结果,也暗示了《索拉 2》的真正优势所在:环境逼真度。

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

提示 4:未来派屋顶追逐战

在最后的测试中,我将动作、灯光和氛围推向了极致:

"黎明时分,未来派城市的景色一望无垠。一名身着深色夹克的赛博朋克快递员背着一个发光的数据包在屋顶上冲刺。一架追击的无人机在天线和通风口之间穿梭,推进器闪烁着蓝色的光芒。

摄影机以手持的方式从跑者的后面和右侧跟踪,拍摄他们飞跃一个缺口的过程。无人机在半空中超车;镜头炫光和运动模糊使整个场景更加完美"。

效果令人惊叹--出人意料的电影效果。

灯光效果非常出色:日出的余晖在玻璃塔上闪烁,金属表面上的反光,以及跳跃过程中微妙的镜头闪光。运动感觉流畅而有力。无人机的追逐引入了真正的紧张感,而浅景深则模仿了 35 毫米胶片相机。

这是《索拉 2》的全部亮点--复杂、连贯、可信。如果这是作为游戏或电影的预告片发布,大多数观众第一眼都不会怀疑人工智能的参与。

Video source: Notebookcheck - Darryl Linington, generated with Sora 2

索拉 2 美丽的不可预测性

在这些测试中,有一个事实非常突出:索拉 2》总是前后不一致。有时,它什么都做对了。而有时,它却能创造出让人忍俊不禁的奇异效果。这种不可预测性已成为其魅力的一部分。

在 Reddit 上,一位用户对此进行了完美的总结:

"《索拉 2》要么给你皮克斯的感觉,要么给你发烧梦的能量,没有两者之间的。"
- r/AIGuild

模型偶尔会扭曲物体,在场景中改变颜色,或者以令人愉悦的荒谬方式曲解提示。有一次,"两只毛绒动物并排走 "的提示产生了看起来一半是泰迪熊、一半是充气气球的动物。这并不准确,但却令人难忘。

对于需要可靠性的专业人士来说,这种混乱可能是一种负担,但对于创意实验来说,它就是金子。Sora 2 有时更像是一个想象力丰富的合作者,而不是一台可预测的机器。

现实与真实了解 Sora 2 的优势

当《索拉 2》发挥作用时,感觉就像变魔术一样。但它并不是魔法,而是一台通过概率和视觉模式学习来解释你的话语的机器。它依赖于语境而非精确度。给它一个强烈的场所感--灯光方向、镜头移动、色调--它就能令人信服地完成其他部分。如果要求它进行精确的舞蹈编排或精细的动作交互,它就会望而却步。

这种模式与其他人在 Reddit 和 Discord 测试小组中观察到的情况相吻合。创作者们指出,较简单的人类动作(走路、看人、打手势)是可信的,但复杂的动作(打斗、拥抱、演奏乐器)很快就会崩溃。这表明,OpenAI 的物理建模仍将人体视为一组独立的运动集群,而不是一个整体。这在几秒钟内足够逼真--然后熵就占据了上风。

更广泛的背景:算法时代的创造力

Sora 2》的魅力不仅在于它的技术进步......更在于它所代表的文化转变。

几十年来,视频创作既昂贵又耗时,还受到设备或人才的限制。现在,任何人只要有一个好点子和一段文字,就能制作出引人入胜的视觉效果。

这种民主化是强大的,但同时也模糊了创作者的身份。当模特 "想象 "的部分场景不正确时,这究竟是失败还是诠释?

在我的中央公园决斗中,扭曲的武器破坏了真实感,却带来了梦幻般的效果。这不是我想要的,但却暗示了一种超现实的、绘画般的美感--更接近实验电影而非好莱坞动作片。

也许这就是更深刻的教训:人工智能电影制作不在于控制。而是协商。

技术和道德界限

OpenAI 意识到围绕这一工具的兴奋与不安。该公司继续限制访问权限,理由是可能会出现滥用,而且需要内容保障。

日本政府最近敦促OpenAI确保《Sora 2》不侵犯动漫版权--这提醒我们,人工智能的创造力会带来现实世界中的法律后果。然后是原创性问题。索拉 2》的输出可能看起来很新颖,但它们是在大量现有媒体的基础上训练出来的。它变得越逼真,就越难将致敬与复制区分开来。这就是为什么《Sora 2》尽管令人惊叹,但却处于艺术性和自动化之间的十字路口。

Sora 2 的定价。(图片来源:OpenAI)
Sora 2 的定价。(图片来源:OpenAI)

音频问题非常明显

大多数《索拉 2》短片在音效方面仍然存在问题。虽然视觉效果往往令人惊叹,但音效往往听起来很差、平淡、闷哑或不自然。Sora 2 试图同时生成环境噪音、特效和对话,但无法像真正的音效设计师那样将它们分开。结果就是音频过度压缩、金属音质或奇怪的平衡,很少能与电影级的视觉效果相匹配。就目前而言,让《索拉 2》视频变得动听的最佳方法是在后期制作中添加音效,将真实世界的氛围、特效和音乐分层,让场景栩栩如生。

未来一瞥,不完美渲染

经过几天的测试,《Sora 2》给我留下了深刻的印象,让我大开眼界,也让我感到有些不安。它既是工程技术的奇迹,也提醒我们人类的动作、情感和故事讲述仍然具有独特的复杂性。

优点:环境、照明、氛围、动态运动和短片的逼真度。

不足之处人体接触、武器物理、偶尔的超现实扭曲。

索拉 2》真的出色吗?

索拉 2》在人工智能辅助电影制作方面迈出了相当不错的一步...只是现在还不要指望完美无瑕的真实感。此外,真正的电影制作者仍然是我们需要的真正的艺术家...因为 Sora 2 仍在努力以自然的方式移动人类和动物的锑。

正如一位 Redditor 所说

"《索拉 2》给人的感觉就像看着未来学习如何做梦。"
- r/OpenAI

这是一个恰当的总结。索拉 2 不只是模拟现实...它是对现实的实验。对于我们这些观看这一切展开的人来说,这既令人激动,又深具人性......只是音质极差

Please share our article, every link counts!
Mail Logo
> Notebookcheck中文版(NBC中国) > 新闻 > 新闻档案 > 新闻档案 2025 11 > Sora 2 是 OpenAI 始终不变的人工智能视频创作者
Darryl Linington, 2025-11-12 (Update: 2025-11-13)