一句话生成60秒逼真视频，OpenAI文生视频模型Sora刷屏，原来可以这样玩

枫口财经记者刘健

在开发出流行的聊天机器人ChatGPT 后，OpenAI 继续在生成人工智能领域进行创新。 2月16日，OpenAI发布了Sora，这是一种新的AI模型，可以通过快速的文本提示创建“现实”和“富有想象力”的60秒视频。 Vincent 视频模型Sora 包含高度详细的场景、复杂的摄像机运动、充满活力的情感的多个角色，甚至可以从静态图像制作动画。 Sora 不仅了解您在提示中提出的要求，还了解它们在物理世界中的存在方式。

文本生成的视频具有逼真的效果。目前，OpenAI官网上关于Sora的信息有限。 “我们教人工智能理解和模拟运动中的物理世界，目标是训练模型来帮助解决人们需要的问题。Sora 说，它可以根据文本描述生成长达60 秒的视频，甚至可以创建多个镜头。”反映单个生成视频中的角色或视觉风格。

Sora 可以一次生成整个视频，也可以扩展生成的视频以使其更长。 OpenAI 表示：通过让模型一次生成多个帧，我们解决了即使生成的主体暂时离开视线也不会发生变化的难题。

OpenAI 表示，Sora 是基于之前对DALL-E 和GPT 模型的研究。使用DALLE 3 技术更密切地跟踪生成视频中用户的文本描述。除了能够生成视频之外，该模型还可以从现有的静态图像生成视频，并准确细致地制作动画图像内容。该模型还可以提取和增强现有视频并填充缺失的帧。

目前，OpenAI官网已更新了Sora生成的48个视频演示，色彩鲜艳、效果逼真。

OpenAI Sora 的AI 生成视频图像：猛犸象在雪地里行走

上面截图中的视频文字是：几头巨大的猛犸象在雪地上行走，远处白雪覆盖的树木和雄伟的雪山拔地而起。低镜头拍摄的大型毛茸茸的哺乳动物，雾蒙蒙的光线，高高的云朵和太阳在远处营造出温暖的光芒，摄影和景深都很美丽。

有些作品的光影动态效果令人印象深刻，例如东京路灯霓虹灯下行走的女子视频、阿马尔菲海岸一座教堂的鸟瞰图、跪着的卡通怪物等。神秘地呈现在观者面前。融化的蜡烛。

OpenAI Sora 的AI 生成视频图像：一名女子在东京路灯的霓虹灯下行走

上图截图中的视频文字提示为：一位时尚女性走在充满温暖霓虹灯和动画城市标志的东京街道上。她穿着黑色皮夹克、红色长裙、黑色靴子，拎着黑色钱包。她戴着墨镜，涂着红色口红。她走起路来充满自信和轻松。街道潮湿且反光，在五彩的灯光下营造出镜面般的效果。许多行人在周围走动。

在某些场景中，索拉的效果足以“掩盖真实的事物”。在这段展示东京地铁车窗的8 秒视频中，除了车窗移动时的倒影外，您还可以看到中间人物的倒影。视频也非常真实。

Sora 的声明被网友称为游戏结束后，OpenAI 首席执行官Sam Altman 要求社交媒体用户使用文本提示在线提交创意内容。

“新罕布什尔州的一位自由摄影师建议我使用完整的电影灯光，”大约一个小时后，奥特曼用一段逼真的视频回应道。

奥特曼的动作展示了Sora模型实时生成视频的能力。

苏州证券此前表示，近期视觉算法在通用性、即时性、生产质量、稳定性等方面的进步将促进技术拐点的到来和大众应用的出现。数据和算法比图像生成更困难。随着2024 年的发展，该行业可能会取得更大的成功。

2023年底至2024年初，Pika、HeyGen等AI视频应用将陆续发布，展现多模态技术的不断进步和成熟。毫无疑问，刚刚发布的Sora车型加剧了这一球场的激烈竞争。

这位网友游戏结束了，丢了工作。

一些人已经开始“哀悼”整个行业。

有网友表示，电影界将彻底翻天覆地。未来，如果你会写剧本，你就可以直接拍电影，而不是“拍”电影。从现在开始，从导演到演员再到摄影师，所有人都将失业。

YouTuber 之一帕迪·加洛韦(Paddy Galloway) 表达了他对Sora 的看法，他表示内容创作行业已经永远改变，这并不夸张。 “我在YouTube 世界里工作了15 年，对OpenAI 刚刚展示的内容感到无语……动画师和3D 艺术家陷入困境，资源网站变得无关紧要，每个人都可以毫无障碍地做到这一点。您的内容背后的“想法”和故事将变得更加重要。 ”

Sora还有很大的进步空间。 Sora的视频一经发布就震惊了业界。虽然这不是第一个AI 视频，但其他公司也开发了类似的用于文本生成视频的AI 模型，其中Google 测试了名为Lumiere 的模型，Meta 测试了名为Emu 的模型。人工智能初创公司Runway 也在开发相应的产品来辅助制作。不过，外媒报道称，人工智能专家和分析师指出，Sora 的视频长度和质量都超过了之前看到的水平。

硅谷一家AI公司的从业者表示，根据他的经验，演示视频中展示的Sora的能力远远超过了Pika和Runway。 “Pika只能生成3-15秒的视频，而Sora可以直接生成1分钟的视频。从视觉效果和时长来看，Sora绝对是一个重大进步。”

CNN 援引市场研究公司ABI Research 高级分析师Hayden 的话说，随着新的个性化内容在不同渠道传播，《Sora》可能会对数字娱乐市场产生重大影响。

空有时会做出不合理的事情，例如在跑步机上倒跑。

不过，现在的Sora还有很多需要改进的地方。 OpenAI 提示：当前的Sora 模型也存在弱点，难以准确模拟复杂场景中的物理现象，并且可能无法理解某些因果关系。

空在理解空间细节时感到困惑，无法理解因果关系的具体实例，例如有人制作了某人咬饼干的视频，但随后饼干上没有留下咬痕。

Sora 制作的视频：五只狼崽在绿草环绕的碎石路上顽皮地互相追逐。

Sora 制作的视频中，动物和人突然出现，尤其是在有许多实体的场景中。此外，Sora 很难准确描述随着时间推移发生的事件，例如跟踪摄像机的特定轨迹。

Sora 制作的视频：在沙漠中发现了一把普通的塑料椅子，被小心地挖出来并清除灰尘。在此示例中，Sora 没有将椅子建模为刚体，导致物理交互不准确。

OpenAI 表示，计划与专家团队合作测试其最新模型，并留意错误信息、仇恨内容和偏见。 OpenAI 还表示，它正在开发工具来帮助检测误导性信息，包括可以确定Sora 何时生成视频的检测分类器。其文本分类器会检查并拒绝违反使用政策的文本输入提示，例如极端暴力、色情内容、骚扰图像和名人肖像。 “我们还开发了一个强大的图像分类器，可以检查每个生成的视频帧，以确保其在向用户显示之前符合使用政策。”

OpenAI 表示，Sora 将首先提供给网络安全教授来评估该产品的危险和风险。选定的视觉艺术家、设计师和电影制作人还可以访问Sora，收集有关创意专业人士如何使用Sora 的反馈。

本文和图片来自网络，不代表火豚游戏立场，如若侵权请联系我们删除：https://www.huotun.com/game/580291.html

一句话生成60秒逼真视频，OpenAI文生视频模型Sora刷屏，原来可以这样玩

相关推荐

和平精英雨林由来？ 和平精英高光锦集哪里弄？

又矮又黑又瘦的女生怎样打扮？

和平精英飞车教学技巧？

ipad和平精英怎么录制高清画质？

和平精英职业玩家手机耳机配置？

和平精英雨林由来？和平精英高光锦集哪里弄？