OpenAI 推出 Sora 2：人工智能视频获得真实物理效果和用户客串

OpenAI 通过 Sora 2 推动人工智能视频向前发展（图片来源：OpenAI）

OpenAI 推出了新的视频和音频生成模型 Sora 2，提高了物理逼真度和用户控制能力。此次发布还包括一个新的社交应用，旨在让用户尝试人工智能生成的媒体和客串。

Andrew Sozinov (translated by Ninh Duy), Published 10/01/2025 🇺🇸 🇪🇸 ...

AI Launch iOS Social Media

OpenAI 正式发布了用于视频和音频生成的最新旗舰模型 Sora 2，将其定位为人工智能驱动的内容创建领域的一次重大飞跃。新模型提供了更逼真的物理效果、更强的可控性，并引入了同步对话和环境音效，将人工智能生成内容的沉浸感提升到了一个新的水平。Sora 2 与新的社交应用 Sora 同时亮相，旨在改变人们与人工智能生成的媒体的互动方式。今天（2025 年 9 月 30 日）开始在美国和加拿大推出。

OpenAI 描述了最初的 Sora模型（2024 年初发布）是生成视频的关键一步--类似于 GPT-1 对自然语言处理的影响。相比之下，Sora 2 被描述为视频的 "GPT-3.5 时刻"，为人工智能对物理现实和世界模拟的理解设定了新的标准。

根据 OpenAI 的说法，Sora 2 代表着 "世界模拟 "能力的一个进步。早期的系统通常会弯曲现实以满足提示，而 Sora 2 则旨在模拟合理的结果，包括篮球场景中的失误和篮板，而不是根据脚本传送物体。现在，该模型可以渲染以往系统无法渲染的场景，如奥运会级别的体操动作、模拟浮力和刚度动态的精确水上后空翻，甚至是猫咪死死抓住的三轴旋转。这些进步还体现在系统的音频方面：Sora 2 可生成背景音效、同步语音和音效，与屏幕上的动作配合得天衣无缝，为真实感增添了新的维度。

它的一大亮点是可以 "上传自己"。用户可以录制一段简短的视频和音频样本，让 Sora 2 将他们（或朋友、动物和现实世界中的任何物体）插入到任何生成的场景中，并以高精度的视觉和语音表现出来。

为了展示 Sora 2 的功能，OpenAI 推出了一款名为 Sora 的新 iOS 应用程序。该应用可让用户创建和混编短视频，在可定制的信息源中发现社区内容，并通过 "cameos "功能在人工智能生成的场景中出演。客串 "需要一个简短的验证过程，以确保用户的控制和同意，并提供隐私和内容删除的完整选项。

OpenAI 将新的 Sora 应用程序定位为 "创造优先"，而不是 "参与最大化"。默认推送优先考虑你关注的人和有可能激发你创作灵感的内容；该公司表示，它不会对花费的时间进行优化。青少年账户有每日浏览限制和更严格的客串权限，而家长控制(通过 ChatGPT）允许进行重写，如禁用算法个性化或限制无限滚动。OpenAI 还在加强人工审核，以应对欺凌和其他滥用风险。

Sora 2 今天在美国和加拿大推出，并计划扩展到其他地区。该应用以邀请制形式推出，以鼓励朋友间的协作使用。该模式最初免费使用，但有 "宽松的限制"，受计算能力限制。ChatGPT Pro 用户可以首先通过 ChatGPT 访问高质量的 Sora 2 Pro 模型，Sora 应用程序也将很快提供支持。OpenAI 还计划通过 API 发布 Sora 2，以实现更广泛的集成。使用 Sora 1 Turbo 生成的内容仍可在用户库中访问。

OpenAI 将 Sora 2 视为开发通用世界模拟器以及最终开发高级机器人的重要一步。该公司认为，改进视频原生人工智能模型不仅是开发创意工具的途径，也是开发能更好地理解物理世界、与物理世界互动并最终在物理世界中发挥作用的系统的途径。