枫口财经记者刘健
在开发出流行的聊天机器人ChatGPT 后,OpenAI 继续在生成人工智能领域进行创新。 2月16日,OpenAI发布了Sora,这是一种新的AI模型,可以通过快速的文本提示创建“现实”和“富有想象力”的60秒视频。 Vincent 视频模型Sora 包含高度详细的场景、复杂的摄像机运动、充满活力的情感的多个角色,甚至可以从静态图像制作动画。 Sora 不仅了解您在提示中提出的要求,还了解它们在物理世界中的存在方式。
文本生成的视频具有逼真的效果。目前,OpenAI官网上关于Sora的信息有限。 “我们教人工智能理解和模拟运动中的物理世界,目标是训练模型来帮助解决人们需要的问题。Sora 说,它可以根据文本描述生成长达60 秒的视频,甚至可以创建多个镜头。”反映单个生成视频中的角色或视觉风格。
Sora 可以一次生成整个视频,也可以扩展生成的视频以使其更长。 OpenAI 表示:通过让模型一次生成多个帧,我们解决了即使生成的主体暂时离开视线也不会发生变化的难题。
OpenAI 表示,Sora 是基于之前对DALL-E 和GPT 模型的研究。使用DALLE 3 技术更密切地跟踪生成视频中用户的文本描述。除了能够生成视频之外,该模型还可以从现有的静态图像生成视频,并准确细致地制作动画图像内容。该模型还可以提取和增强现有视频并填充缺失的帧。
目前,OpenAI官网已更新了Sora生成的48个视频演示,色彩鲜艳、效果逼真。
OpenAI Sora 的AI 生成视频图像:猛犸象在雪地里行走
上面截图中的视频文字是: 几头巨大的猛犸象在雪地上行走,远处白雪覆盖的树木和雄伟的雪山拔地而起。低镜头拍摄的大型毛茸茸的哺乳动物,雾蒙蒙的光线,高高的云朵和太阳在远处营造出温暖的光芒,摄影和景深都很美丽。
有些作品的光影动态效果令人印象深刻,例如东京路灯霓虹灯下行走的女子视频、阿马尔菲海岸一座教堂的鸟瞰图、跪着的卡通怪物等。神秘地呈现在观者面前。融化的蜡烛。
OpenAI Sora 的AI 生成视频图像:一名女子在东京路灯的霓虹灯下行走
上图截图中的视频文字提示为:一位时尚女性走在充满温暖霓虹灯和动画城市标志的东京街道上。她穿着黑色皮夹克、红色长裙、黑色靴子,拎着黑色钱包。她戴着墨镜,涂着红色口红。她走起路来充满自信和轻松。街道潮湿且反光,在五彩的灯光下营造出镜面般的效果。许多行人在周围走动。
在某些场景中,索拉的效果足以“掩盖真实的事物”。在这段展示东京地铁车窗的8 秒视频中,除了车窗移动时的倒影外,您还可以看到中间人物的倒影。视频也非常真实。
Sora 的声明被网友称为游戏结束后,OpenAI 首席执行官Sam Altman 要求社交媒体用户使用文本提示在线提交创意内容。
“新罕布什尔州的一位自由摄影师建议我使用完整的电影灯光,”大约一个小时后,奥特曼用一段逼真的视频回应道。
奥特曼的动作展示了Sora模型实时生成视频的能力。
苏州证券此前表示,近期视觉算法在通用性、即时性、生产质量、稳定性等方面的进步将促进技术拐点的到来和大众应用的出现。数据和算法比图像生成更困难。随着2024 年的发展,该行业可能会取得更大的成功。
2023年底至2024年初,Pika、HeyGen等AI视频应用将陆续发布,展现多模态技术的不断进步和成熟。毫无疑问,刚刚发布的Sora车型加剧了这一球场的激烈竞争。
这位网友游戏结束了,丢了工作。
一些人已经开始“哀悼”整个行业。
有网友表示,电影界将彻底翻天覆地。未来,如果你会写剧本,你就可以直接拍电影,而不是“拍”电影。从现在开始,从导演到演员再到摄影师,所有人都将失业。
YouTuber 之一帕迪·加洛韦(Paddy Galloway) 表达了他对Sora 的看法,他表示内容创作行业已经永远改变,这并不夸张。 “我在YouTube 世界里工作了15 年,对OpenAI 刚刚展示的内容感到无语……动画师和3D 艺术家陷入困境,资源网站变得无关紧要,每个人都可以毫无障碍地做到这一点。您的内容背后的“想法”和故事将变得更加重要。 ”
Sora还有很大的进步空间。 Sora的视频一经发布就震惊了业界。虽然这不是第一个AI 视频,但其他公司也开发了类似的用于文本生成视频的AI 模型,其中Google 测试了名为Lumiere 的模型,Meta 测试了名为Emu 的模型。人工智能初创公司Runway 也在开发相应的产品来辅助制作。不过,外媒报道称,人工智能专家和分析师指出,Sora 的视频长度和质量都超过了之前看到的水平。
硅谷一家AI公司的从业者表示,根据他的经验,演示视频中展示的Sora的能力远远超过了Pika和Runway。 “Pika只能生成3-15秒的视频,而Sora可以直接生成1分钟的视频。从视觉效果和时长来看,Sora绝对是一个重大进步。”
CNN 援引市场研究公司ABI Research 高级分析师Hayden 的话说,随着新的个性化内容在不同渠道传播,《Sora》可能会对数字娱乐市场产生重大影响。
空有时会做出不合理的事情,例如在跑步机上倒跑。
不过,现在的Sora还有很多需要改进的地方。 OpenAI 提示:当前的Sora 模型也存在弱点,难以准确模拟复杂场景中的物理现象,并且可能无法理解某些因果关系。
空在理解空间细节时感到困惑,无法理解因果关系的具体实例,例如有人制作了某人咬饼干的视频,但随后饼干上没有留下咬痕。
Sora 制作的视频:五只狼崽在绿草环绕的碎石路上顽皮地互相追逐。
Sora 制作的视频中,动物和人突然出现,尤其是在有许多实体的场景中。此外,Sora 很难准确描述随着时间推移发生的事件,例如跟踪摄像机的特定轨迹。
Sora 制作的视频:在沙漠中发现了一把普通的塑料椅子,被小心地挖出来并清除灰尘。在此示例中,Sora 没有将椅子建模为刚体,导致物理交互不准确。
OpenAI 表示,计划与专家团队合作测试其最新模型,并留意错误信息、仇恨内容和偏见。 OpenAI 还表示,它正在开发工具来帮助检测误导性信息,包括可以确定Sora 何时生成视频的检测分类器。其文本分类器会检查并拒绝违反使用政策的文本输入提示,例如极端暴力、色情内容、骚扰图像和名人肖像。 “我们还开发了一个强大的图像分类器,可以检查每个生成的视频帧,以确保其在向用户显示之前符合使用政策。”
OpenAI 表示,Sora 将首先提供给网络安全教授来评估该产品的危险和风险。选定的视觉艺术家、设计师和电影制作人还可以访问Sora,收集有关创意专业人士如何使用Sora 的反馈。
本文和图片来自网络,不代表火豚游戏立场,如若侵权请联系我们删除:https://www.huotun.com/game/580291.html