一句话生成60秒逼真视频,OpenAI文生视频模型Sora刷屏,原来可以这样玩

枫口财经记者刘健

在开发出流行的聊天机器人ChatGPT 后,OpenAI 继续在生成人工智能领域进行创新。 2月16日,OpenAI发布了Sora,这是一种新的AI模型,可以通过快速的文本提示创建“现实”和“富有想象力”的60秒视频。 Vincent 视频模型Sora 包含高度详细的场景、复杂的摄像机运动、充满活力的情感的多个角色,甚至可以从静态图像制作动画。 Sora 不仅了解您在提示中提出的要求,还了解它们在物理世界中的存在方式。

文本生成的视频具有逼真的效果。目前,OpenAI官网上关于Sora的信息有限。 “我们教人工智能理解和模拟运动中的物理世界,目标是训练模型来帮助解决人们需要的问题。Sora 说,它可以根据文本描述生成长达60 秒的视频,甚至可以创建多个镜头。”反映单个生成视频中的角色或视觉风格。

Sora 可以一次生成整个视频,也可以扩展生成的视频以使其更长。 OpenAI 表示:通过让模型一次生成多个帧,我们解决了即使生成的主体暂时离开视线也不会发生变化的难题。

OpenAI 表示,Sora 是基于之前对DALL-E 和GPT 模型的研究。使用DALLE 3 技术更密切地跟踪生成视频中用户的文本描述。除了能够生成视频之外,该模型还可以从现有的静态图像生成视频,并准确细致地制作动画图像内容。该模型还可以提取和增强现有视频并填充缺失的帧。

目前,OpenAI官网已更新了Sora生成的48个视频演示,色彩鲜艳、效果逼真。

OpenAI Sora 的AI 生成视频图像:猛犸象在雪地里行走

上面截图中的视频文字是: 几头巨大的猛犸象在雪地上行走,远处白雪覆盖的树木和雄伟的雪山拔地而起。低镜头拍摄的大型毛茸茸的哺乳动物,雾蒙蒙的光线,高高的云朵和太阳在远处营造出温暖的光芒,摄影和景深都很美丽。

有些作品的光影动态效果令人印象深刻,例如东京路灯霓虹灯下行走的女子视频、阿马尔菲海岸一座教堂的鸟瞰图、跪着的卡通怪物等。神秘地呈现在观者面前。融化的蜡烛。

OpenAI Sora 的AI 生成视频图像:一名女子在东京路灯的霓虹灯下行走

上图截图中的视频文字提示为:一位时尚女性走在充满温暖霓虹灯和动画城市标志的东京街道上。她穿着黑色皮夹克、红色长裙、黑色靴子,拎着黑色钱包。她戴着墨镜,涂着红色口红。她走起路来充满自信和轻松。街道潮湿且反光,在五彩的灯光下营造出镜面般的效果。许多行人在周围走动。

在某些场景中,索拉的效果足以“掩盖真实的事物”。在这段展示东京地铁车窗的8 秒视频中,除了车窗移动时的倒影外,您还可以看到中间人物的倒影。视频也非常真实。

Sora 的声明被网友称为游戏结束后,OpenAI 首席执行官Sam Altman 要求社交媒体用户使用文本提示在线提交创意内容。

“新罕布什尔州的一位自由摄影师建议我使用完整的电影灯光,”大约一个小时后,奥特曼用一段逼真的视频回应道。

奥特曼的动作展示了Sora模型实时生成视频的能力。

苏州证券此前表示,近期视觉算法在通用性、即时性、生产质量、稳定性等方面的进步将促进技术拐点的到来和大众应用的出现。数据和算法比图像生成更困难。随着2024 年的发展,该行业可能会取得更大的成功。

2023年底至2024年初,Pika、HeyGen等AI视频应用将陆续发布,展现多模态技术的不断进步和成熟。毫无疑问,刚刚发布的Sora车型加剧了这一球场的激烈竞争。

这位网友游戏结束了,丢了工作。

一些人已经开始“哀悼”整个行业。

有网友表示,电影界将彻底翻天覆地。未来,如果你会写剧本,你就可以直接拍电影,而不是“拍”电影。从现在开始,从导演到演员再到摄影师,所有人都将失业。

YouTuber 之一帕迪·加洛韦(Paddy Galloway) 表达了他对Sora 的看法,他表示内容创作行业已经永远改变,这并不夸张。 “我在YouTube 世界里工作了15 年,对OpenAI 刚刚展示的内容感到无语……动画师和3D 艺术家陷入困境,资源网站变得无关紧要,每个人都可以毫无障碍地做到这一点。您的内容背后的“想法”和故事将变得更加重要。 ”

Sora还有很大的进步空间。 Sora的视频一经发布就震惊了业界。虽然这不是第一个AI 视频,但其他公司也开发了类似的用于文本生成视频的AI 模型,其中Google 测试了名为Lumiere 的模型,Meta 测试了名为Emu 的模型。人工智能初创公司Runway 也在开发相应的产品来辅助制作。不过,外媒报道称,人工智能专家和分析师指出,Sora 的视频长度和质量都超过了之前看到的水平。

硅谷一家AI公司的从业者表示,根据他的经验,演示视频中展示的Sora的能力远远超过了Pika和Runway。 “Pika只能生成3-15秒的视频,而Sora可以直接生成1分钟的视频。从视觉效果和时长来看,Sora绝对是一个重大进步。”

CNN 援引市场研究公司ABI Research 高级分析师Hayden 的话说,随着新的个性化内容在不同渠道传播,《Sora》可能会对数字娱乐市场产生重大影响。

空有时会做出不合理的事情,例如在跑步机上倒跑。

不过,现在的Sora还有很多需要改进的地方。 OpenAI 提示:当前的Sora 模型也存在弱点,难以准确模拟复杂场景中的物理现象,并且可能无法理解某些因果关系。

空在理解空间细节时感到困惑,无法理解因果关系的具体实例,例如有人制作了某人咬饼干的视频,但随后饼干上没有留下咬痕。

Sora 制作的视频:五只狼崽在绿草环绕的碎石路上顽皮地互相追逐。

Sora 制作的视频中,动物和人突然出现,尤其是在有许多实体的场景中。此外,Sora 很难准确描述随着时间推移发生的事件,例如跟踪摄像机的特定轨迹。

Sora 制作的视频:在沙漠中发现了一把普通的塑料椅子,被小心地挖出来并清除灰尘。在此示例中,Sora 没有将椅子建模为刚体,导致物理交互不准确。

OpenAI 表示,计划与专家团队合作测试其最新模型,并留意错误信息、仇恨内容和偏见。 OpenAI 还表示,它正在开发工具来帮助检测误导性信息,包括可以确定Sora 何时生成视频的检测分类器。其文本分类器会检查并拒绝违反使用政策的文本输入提示,例如极端暴力、色情内容、骚扰图像和名人肖像。 “我们还开发了一个强大的图像分类器,可以检查每个生成的视频帧,以确保其在向用户显示之前符合使用政策。”

OpenAI 表示,Sora 将首先提供给网络安全教授来评估该产品的危险和风险。选定的视觉艺术家、设计师和电影制作人还可以访问Sora,收集有关创意专业人士如何使用Sora 的反馈。

本文和图片来自网络,不代表火豚游戏立场,如若侵权请联系我们删除:https://www.huotun.com/game/580291.html

(0)
上一篇 2024年5月25日
下一篇 2024年5月25日

相关推荐

  • 和平精英雨林由来? 和平精英高光锦集哪里弄?

    和平精英雨林由来? 回答如下:《和平精英》是一款由腾讯公司推出的大型多人在线射击游戏,游戏背景设定在一个虚构的岛屿上。而"雨林"是游戏中的一个地图,被称为雨林是因为该地图有着茂密的热带雨林植被。在这个地图上,玩家需要与其他玩家进行战斗,最终生存下来成为最后的幸存者。 和平精英高光锦集哪里弄? 设置里面有精彩操作录制,要开启权限 apex如…

    游戏快讯 4小时前
  • 又矮又黑又瘦的女生怎样打扮?

    我听过一个色彩讲座,一个形象顾问问过许多人一个问题:皮肤黑的人应该穿浅色还是深色的衣服,大多数人说:穿浅色。其实穿浅色会让你显得更黑。皮肤白的人穿浅色或深色变化不大,皮肤黑的人穿深色反而会显得很白,这是色彩的视觉补色原理,还有,肤色黑的人适合色彩浓度较高较纯正的颜色,太浊的颜色会让黑皮肤的人看上去不精神。所以肤色黑的人一定不要对自己失望,因为很多生活中看起来…

    游戏快讯 6小时前
  • 和平精英飞车教学技巧?

    和平精英飞车教学技巧? 在和平精英中,飞车是一项非常重要的技能,需要通过不断的练习和掌握技巧来提高。在飞车时,需要注意车速和路况,并且掌握好飞车的时间和角度。同时,可以通过使用道具和技能来增加自己的速度和灵活性,提高飞车的成功率。 最重要的是,要保持耐心和冷静,不要过于冒险和鲁莽,以避免意外发生。通过不断的实践和总结,你会变得更加熟练和自信。 和平精英开车过…

    游戏快讯 7小时前
  • ipad和平精英怎么录制高清画质?

    ipad和平精英怎么录制高清画质? 操作方法 01 首先我们登录和平精英游戏,进入到游戏首页 和平精英怎么录屏 02 然后我们点击界面下方的【设置】按钮,打开设置界面 和平精英怎么录屏 03 点击右侧的【录像设置】选项 04 可以看到精彩时刻和自由录制,两种录屏方式,我们点击开,可以打开,但是只能开一个 和平精英怎么录屏 05 我们在游戏对战的时候,可以点击…

    游戏快讯 10小时前
  • 和平精英职业玩家手机耳机配置?

    和平精英职业玩家手机耳机配置? 许多玩家更的都是蓝牙耳机或者无线耳机 华为手机和平精英耳机设置? 华为吃鸡声音均衡器这样设置: 第一:histen音效选择普通 。 第二:耳机选择华为主动降噪耳机2代 。 第三:均衡器设:看个人需求。 2000多玩和平精英选哪个手机? 2000多玩和平精英的手机有很多款,唯有OPPO华为荣耀系列等等手机ioqq系列的手机也是非…

    游戏快讯 11小时前