OpenAI 正式发布了用于视频和音频生成的最新旗舰模型 Sora 2,将其定位为人工智能驱动的内容创建领域的一次重大飞跃。新模型提供了更逼真的物理效果、更强的可控性,并引入了同步对话和环境音效,将人工智能生成内容的沉浸感提升到了一个新的水平。Sora 2 与新的社交应用 Sora 同时亮相,旨在改变人们与人工智能生成的媒体的互动方式。今天(2025 年 9 月 30 日)开始在美国和加拿大推出。
OpenAI 描述了最初的 Sora模型(2024 年初发布)是生成视频的关键一步--类似于 GPT-1 对自然语言处理的影响。相比之下,Sora 2 被描述为视频的 "GPT-3.5 时刻",为人工智能对物理现实和世界模拟的理解设定了新的标准。
根据 OpenAI 的说法,Sora 2 代表着 "世界模拟 "能力的一个进步。早期的系统通常会弯曲现实以满足提示,而 Sora 2 则旨在模拟合理的结果,包括篮球场景中的失误和篮板,而不是根据脚本传送物体。现在,该模型可以渲染以往系统无法渲染的场景,如奥运会级别的体操动作、模拟浮力和刚度动态的精确水上后空翻,甚至是猫咪死死抓住的三轴旋转。这些进步还体现在系统的音频方面:Sora 2 可生成背景音效、同步语音和音效,与屏幕上的动作配合得天衣无缝,为真实感增添了新的维度。
它的一大亮点是可以 "上传自己"。用户可以录制一段简短的视频和音频样本,让 Sora 2 将他们(或朋友、动物和现实世界中的任何物体)插入到任何生成的场景中,并以高精度的视觉和语音表现出来。
为了展示 Sora 2 的功能,OpenAI 推出了一款名为 Sora 的新 iOS 应用程序。该应用可让用户创建和混编短视频,在可定制的信息源中发现社区内容,并通过 "cameos "功能在人工智能生成的场景中出演。客串 "需要一个简短的验证过程,以确保用户的控制和同意,并提供隐私和内容删除的完整选项。
OpenAI 将新的 Sora 应用程序定位为 "创造优先",而不是 "参与最大化"。默认推送优先考虑你关注的人和有可能激发你创作灵感的内容;该公司表示,它不会对花费的时间进行优化。青少年账户有每日浏览限制和更严格的客串权限,而 家长控制(通过 ChatGPT)允许进行重写,如禁用算法个性化或限制无限滚动。OpenAI 还在加强人工审核,以应对欺凌和其他滥用风险。
Sora 2 今天在美国和加拿大推出,并计划扩展到其他地区。该应用以邀请制形式推出,以鼓励朋友间的协作使用。该模式最初免费使用,但有 "宽松的限制",受计算能力限制。ChatGPT Pro 用户可以首先通过 ChatGPT 访问高质量的 Sora 2 Pro 模型,Sora 应用程序也将很快提供支持。OpenAI 还计划通过 API 发布 Sora 2,以实现更广泛的集成。使用 Sora 1 Turbo 生成的内容仍可在用户库中访问。
OpenAI 将 Sora 2 视为开发通用世界模拟器以及最终开发高级机器人的重要一步。该公司认为,改进视频原生人工智能模型不仅是开发创意工具的途径,也是开发能更好地理解物理世界、与物理世界互动并最终在物理世界中发挥作用的系统的途径。
» Notebookcheck多媒体笔记本电脑Top 10排名
» Notebookcheck游戏笔记本电脑Top 10排名
» Notebookcheck低价办公/商务笔记本电脑Top 10排名
» Notebookcheck高端办公/商务笔记本电脑Top 10排名
» Notebookcheck工作站笔记本电脑Top 10排名
» Notebookcheck亚笔记本电脑Top 10排名
» Notebookcheck超级本产品Top 10排名
» Notebookcheck变形本产品Top 10排名
» Notebookcheck平板电脑Top 10排名
» Notebookcheck智能手机Top 10排名
» Notebookcheck评测过最出色的笔记本电脑屏幕
» Notebookcheck售价500欧元以下笔记本电脑Top 10排名
» Notebookcheck售价300欧元以下笔记本电脑Top 10排名