sora是什么意思,sora发布会

本文来自微信公众号:字母榜(ID:wjicaijing),作者:赵金杰,题图来源:视觉中国

空的出现,对于张一鸣来说既是喜悦,又是焦虑。

曾经被OpenAI 的ChatGPT 震惊的大AI 模型行业,再次被该公司首款视频生成模型Sora 震惊。

Runway 和Pika 之类的视频只能从单个镜头角度生成不到10 秒且内容高度扭曲的视频,而Sora 的视频可以从单个镜头生成超过60 秒以及多角度镜头的视频。您还可以最大化单个视频并还原现实世界的真实场景。

ChatGPT 中验证的模型性能缩放法则已被OpenAI 首席执行官Altman 移植到视频领域,他的“大奇迹”策略仍然有效:事实证明,增加模型尺寸将持续下去。提高性能。 ChatGPT 所称赞的“智能涌现”功能又回到了Sora。

面对Sora的“降维攻击”,一些AI视频创业者已经做好了“Game On”的准备,比如Runway首席执行官Cristobal Valenzuela、Pika创始人郭文晶等人都开始玩游戏了。我们正在准备一款与Sora竞争的新产品。其他人,比如Stability AI 首席执行官Emad Mostak,将Sora 视为AI 视频行业的一个时刻,感叹“奥特曼真是一个巫师”。

不过,这对于字节跳动来说或许并不是一个好消息。 Sora正在研究的视频生成赛道,正是字节跳动剪辑目前正在走向的AI创新方向。今年2月从抖音转向电影放映后,界面新闻报道称,抖音前CEO张楠计划推出一款生成照片和视频的AI产品。

张楠原本打算在人工智能视频领域大展拳脚。在这款产品推出之前,他内部的创业计划直接受到了Sola的影响。

OpenAI启发张楠押注AI并开始新业务。随着2023年OpenAI旗下文生图模型DALL-E 2的发布,张楠第一次直观地感受到AI图像生成对传统内容创作方式具有颠覆性的力量。这是字节跳动全球CEO梁如波表示的。搭建新的创作平台的机会也是张楠转向电影剪辑的原因之一。

2023年视频剪辑的出现,将有助于抖音的内容生态从PGC(专业机构制作的内容)向UGC(用户生成的内容)过渡,大幅降低用户创作门槛。如今,随着平台内容生态进入PUGC融合状态,对用户生成视频的成本和整体质量提出了新的要求。人工智能视频产品的出现,为普通人视频创作门槛的降低提供了真正的可能,抖音乃至TikTok有望借此机会,创造内容创作者数量的新一轮爆发。

值得一提的是,AI视频生成是一条很有前景的创业路径。截至2023年底,沿着这条路线涌现了很多独角兽公司。 Midjourney估值100亿美元,Stability AI估值40亿美元,Runway估值15亿美元。 Pika 是一家今年早些时候声名鹊起的初创公司,成立还不到一年,估值为2.5 亿美元。

然而,空的突然袭击之后,留给张一鸣和张楠孵化下一只AI视频独角兽的时间变得更加紧张。

在Sora 首次亮相之前,Byte 也在内部开发人工智能生成的视频产品。

一月份,字节跳动研究人员在arXiv 上发表了一篇论文,介绍了字节正在开发的文本生成视频模型,称为MagicVideo-V2。该模型集成了文本到图像模型、视频运动生成器、参考图像嵌入模块和插值等多个模块。这是一个从文本自动生成视频的模块。

MagicVideo-V2要解决的问题是生成的视频如Runway、Pika等的保真度低、运动不自然、分辨率低、风格多样性低。

Byte的产品砍掉了原有的“将照片和文本转换为电影”功能模块,在Vincent视频转换过程中也面临着上述问题。

随着MagicVideo-V2完成开发并等待从演示转向量产,张楠在我收集的一个多月的用户访谈中分享了更多关于AI生成视频产品的沮丧和期望。一些创作者表示,“为了更好地表达自己的想法,几乎不可能在一款产品中完成所有工作,因此必须跨多个产品经历复杂的编辑和交互过程。”必须使用来完成表达。

去年8月,UP Digital Life Kazik制作的热门视频《流浪地球3预告片》使用了MidJourney、Runway等众多产品,历时5天进行后期剪辑和拼接。

UP Master Digital Life Kagic创作困难的主要原因是AI软件不够智能和便捷。在Sora 之前,业界默认的视频录制方法是仅从单一的、通常是静态的角度输出短视频剪辑,主要具有赛博朋克风格的背景。

Sora 打破了Vincentian 视频领域的古老智慧,只需一个提示即可生成最复杂的视角和场景转换,所有这些都考虑到了便利性。生成的内容与真实的物理世界具有最大的相关性。

Sora提示词示例来源:官网截图

字节和张楠为AI视频规划的更高保真度的生成效果、更锐利的图像生成、更流畅、更自然的逻辑理解能力,在Sora上首次实现。

根据官方声明,Sora 还存在许多不完善之处,因为它尚未接受外部测试,并且“仍处于世界模型研究和应用的早期阶段”。

Meta的首席科学家杨丽坤直接向Sora询问。 “仅仅因为系统可以根据提示生成逼真的视频,并不意味着它真正理解物理世界。”

OpenAI 还指出,Sora 很难准确模拟复杂场景的物理原理,可能无法理解因果关系,还可能会混淆提示的空间细节,例如左侧混淆中有警告。官网上有介绍。准确描述随着时间的推移发生的情况可能很困难,例如跟随特定摄像机的轨迹。这些缺陷可能会导致Sora 制作出不合逻辑的视频,例如一个人在跑步机上跑错方向。

这些未解决的错误是OpenAI 决定尚未完全开放Sora 的原因之一。目前,OpenAI 选择了一组用户进行内部测试,评估关键领域的潜在危害和风险,以获得有价值的反馈并加速模型的进展。

ChatGPT发布后,外界开始认识到Sora等视频生成模型是AGI到来的重要加速器。

OpenAI在其官网上直接写道: “Sora 为能够理解和模拟现实世界的模型提供了基础。我们相信这种能力将成为实现AGI 的一个重要里程碑。”

OpenAI 并不是唯一一家希望使用视频生成模型来驱动AGI 的公司。去年12 月,Runway 提议开发一个通用世界模型,并使用其视频生成Gen-2 来模拟整个世界。 “我们相信人工智能的下一个重大进步将来自于对视觉世界及其动态的理解。”这就是为什么我们正在围绕通用世界模型开展新的长期研究。 ”

理解现实世界的物理已经成为实现AGI的唯一途径。谈到Sora,360创始人周鸿祎坦言,一旦AI连接到摄像头并观看所有现有视频,它理解世界的能力将远远超过我的文本学习。 “这实际上距离AGI 并不遥远。这不是10 年或20 年的问题。它可能很快就会发生,在一两年内。”

确实,在AGI相关概念的启发下,AI影像和视频领域的大型模型公司估值飙升,催生了Midjourney、Stability AI、Runway等众多明星独角兽初创公司。

字节跳动的商业级图像/视频生成也服务于字节跳动的商业需求,比如让字节跳动的广告商能够方便、低成本地制作视频。字节官方告诉PostLate,视频制作成本占字节广告商总广告成本的10-20%。从去年开始,字节已经推出了几款相关产品,帮助广告商减少在这方面的投入。他表示正在开发。

虽然晚了一步推出类似文声视频的产品,但对于张楠来说,过河的机会是随着接触了Sora而来的。

在ChatGPT出现之前,算法缺陷是业界开发大规模交互模型的主要障碍之一。人工智能专家丁磊博士表示,一些大规模模型初创公司“不太擅长训练大规模模型……如果训练方法不对,无论他们有多少GPU……这没有帮助,”他解释道。

在追随Sora的过程中,Pika创始人郭文静表示,当前生成视频发展的一个关键限制是算法成熟度。在视频出现之前,我们没有很好的算法。 ”

Sora的发布无疑再次为业界提供了有效的解决问题思路,也为郭文静、张楠等同领域的创业者提供了成熟算法的参考路线。

随着Sora的正式亮相,落后于上一波语言交互模式的Byte再次在视频领域陷入被动追赶的局面。

2023 年11 月ChatGPT 发布时,百度、阿里巴巴等国内各大厂商相继在去年3 月和4 月发布了自己的大型模型文心一言和统一千文,但Byte 直到8 月份才公布了该模型。

反应慢的后果之一是,文心一言的月活跃量过亿,而字节的同类产品豆宝月活跃量不足1000万。

在1月底的新一期《All Hands》中,梁如波聚焦人工智能进展缓慢,阐释了企业低迷的现状,并表示这是一项“每六个月才会出现一次的技术” .在企业层面,要到2023年才会考虑GPT,行业内所有成功的大型模型初创公司都是在2023年至2023年间成立的。 ”

Byte 将注意力转向更大的型号还为时不晚。 LatePost 报道称,2023 年6 月OpenAI 发布GPT-3 后,Byte 正在训练数十亿参数的大型生成语言模型,但参数规模由于容量有限,模型的生成能力一般,Byte 无法证实。关于商业化的可能性,该公司表示,“投资回报率(ROI)无法计算”,目前的研究还只是表面的。

选择张楠这样的大将用AI改造影院,被外界视为字节想要加速AI发展的信号。

然而,在完成国内兵将部署后,张楠剩下的挑战不仅是严格的时间限制,还有外部芯片供应中断导致的算力不足的问题。

去年10月,对Nvidia旗下A100、A800、H100、H800、L40S等五款GPU芯片的禁令正式生效。对于国内很多大型模型厂商来说,NVIDIA芯片的停产客观上是追求ChatGPT甚至GPT-4的最大障碍。

在缩放定律的指导下,奥特曼提出了大模型时代的“摩尔定律”,芯片需求每三到四个月就会翻一番。这无疑为张楠再次追求空提高了门槛。

招商证券研究员刘帆表示:“对于国内厂商来说,这种大力创造奇迹的模式成功后,硅谷将进入更加疯狂的算力军备竞赛,算力短缺的问题将进一步放大。” ”

参考:

《剪映全员信》 张楠

《揭秘字节AI版图:调集多位高管参战,数款重磅产品内测》 科技星球

《大厂大模型:久违的一把手工程》 迟到的帖子

《“今天,所有VC的会上都在谈Sora”》 中国投资网

《Sora发布后,Pika创始人独家回应钛媒体:很振奋,我们将直接冲》 钛介质

本文来自微信公众号:字母榜(ID:wjicaijing),作者:赵金杰。

该内容为作者独立意见,不代表虎秀立场。禁止任何未经许可的复制。如需许可,请联系hezuo@huxiu.com。

正在改变世界的人和想要改变世界的人都在使用虎秀APP

本文和图片来自网络,不代表火豚游戏立场,如若侵权请联系我们删除:https://www.huotun.com/game/680094.html

(0)
上一篇 2024年6月4日
下一篇 2024年6月4日

相关推荐

  • tvb回到三国粤语在线,回到三国港剧粤语九零港剧网

    对于中国人来说,“《三国演义》”这个词可能会让人想起千军万马集结的壮观景象。 赵云、张飞、关羽等猛将,往往骑着马杀敌,如同在千军万马之中,轻而易举。 诸葛亮、曹操、司马懿等伟人率领军队出征,数量达数万甚至数十万。 像这样的大图案《三国演义》, 香港TVB也根据这个故事制作了电视剧,编号为《回到三国》。 TVB 《回到三国》 海报 不过,这个《回到三国》虽然不…

    游戏快讯 2024年6月4日
  • 回到三国第一集视频,回到三国哪年拍的

    2012年,观众抱怨马国明、杨怡主演的穿越剧《回到三国》“太糟糕了!” 由于特效差、版面小,《三国演义》的历史完全是捏造的。 电影里,刘备、关羽、张飞整天讨论的不是国家政治,而是家庭小问题比如刘备两个妻子之间的争执怎么办等等小问题,而这些小问题经诸葛亮等人商议后,呈交大臣,开会正式讨论。 所以,当导演这样拍摄经典三国演义的题材,凭着“这个故事纯属虚构”这句话…

    游戏快讯 2024年6月4日
  • 三国之诸葛亮是我哥,新三国诸葛亮第几集死

    港剧正在衰落。与20世纪80年代港剧风靡一时相比,如今的港剧极其贫穷。 2012年上映的穿越剧《回到三国》绝对佐证了这一观点。 由林峰、马国明、杨毅等实力派演员主演,刘家豪监制,刘志华、黄玉德编剧,阵容空前强大。还有一件事:黄玉德是《陀枪师姐》、《天上凡间》等著作的编辑和评论家。他的实力毋庸置疑,但这部剧却始终存在着陨落的隐患。 电影中,马国明饰演的司马信沉…

    游戏快讯 2024年6月4日
  • 港剧回到三国的结局,tvb回到三国结局

    大家好,我是唐朝粉丝迪达。想了解更多新鲜娱乐资讯,请关注小编。本文为原创。转载事宜请联系我们。您也可以转发到您的朋友圈。其实很多网友对TVB剧都很熟悉,而且很多观众已经看剧很多年了,可以说是港剧的高级粉丝了。但TVB有很多精彩的电影和电视片段,即使是经验丰富的港剧迷也从未见过。比如《回到三国》的男主角其实是马浚伟吗?今天我想谈谈TVB播出的巡演片段。 返回《…

    游戏快讯 2024年6月4日
  • tvb电视剧回到三国,tvb回到三国粤语在线

    2012年,观众抱怨马国明、杨怡主演的穿越剧《回到三国》“太糟糕了!” 由于特效差、版面小,《三国演义》的历史完全是捏造的。 电影里,刘备、关羽、张飞整天讨论的不是国家政治,而是家庭小问题比如刘备两个妻子之间的争执怎么办等等小问题,而这些小问题经诸葛亮等人商议后,呈交大臣,开会正式讨论。 所以,当导演这样拍摄经典三国演义的题材,凭着“这个故事纯属虚构”这句话…

    游戏快讯 2024年6月4日