文| 青山资本
两年前,ChatGPT 诞生,改变了世界的认知。今年早些时候,文森特视频的大模特Sora一经发布,就成为了全网的热门话题。前段时间,随着AI生成音乐软件Suno V3的诞生,音乐制作迎来了“ChatGPT时刻”。
人工智能正在以更快的速度入侵人类世界。当人工智能之风吹进音乐行业时,它会带走什么?
作为投资者和音乐人,今天我们来谈谈人工智能和音乐。
作为一名投资者,我经常被问到,“人工智能音乐的商业模式是什么?”我的回答是,“它是有效的,但它有其局限性。”
AI音乐并不是一个新名词。除了我们所说的生成方法之外,其实还有一些辅助的创作工具,比如人声分离。回到生成音乐本身,这段历史也很悠久。当我还是学生的时候,我的老师在讲现代音乐。在20世纪50年代,一位美国教授用数学随机生成音乐,一只猫甚至通过踩钢琴来创作音乐。这是一个概率问题。所有生成技术的底层逻辑都是概率。
几年前,中国有一种制作音乐的商业模式。公司就像一个大工厂,每个员工的小隔间里都有一台电脑和一架小电钢琴,每天都要创作几首新歌上传到平台。歌曲就像装配线上生产的产品。遵循既定模式。手工加水加电,每首歌的制作成本就高达数百甚至数千。后续投资也有一定的流程,比如上传1000首歌曲到短视频平台,每首投资10元,选择最好的艺人,继续再投资100元。再次投资,直到听到一首特定的歌曲,传播它并获得利润。流量被输送到音乐流媒体平台,然后音乐流媒体平台向工厂支付版税。不需要评判一首歌的好坏,只要某个歌词或旋律能引起听众的共鸣,传播开来,持续流传,商业模式就是有效的。在这种模式下,大量的电子垃圾产生并堆积在互联网上。 AI音乐可以进一步为此类企业降低成本,将每首歌曲的成本从数百元降低至几元,财务模式必将带来显着优化。
当然,青山不会投资这样的公司。首先,追求更高的天花板。从投资的角度来看,我们希望企业有机会做大事,而不仅仅是赚钱。其次,我们需要考虑商业和投资的社会意义。我从事投资多年,所以不能说我的结果是完美的,但我始终以社会意义作为动机和出发点,我确信除了这些之外还有其他事情需要考虑赚钱。
在上述商业模式中,人工智能降低了制作音乐的成本,但有些人可能想知道它是否会增加收入。换句话说,如果AI有这么强的模仿和学习能力,是不是更有可能创作出爆款歌曲?这是由两件事决定的:歌和火。我认为人工智能在中国流行乐坛创作流行歌曲是非常容易的。如果我们每天生成一百万或一千万首歌曲,必然会有一些歌曲仍然流行。概率问题。然而,做到这一点很困难,因为你听不到火的声音。很多人担心人工智能会创作太多歌曲。事实上,这种情况已经持续了很多年。 QQ音乐、网易云音乐、Spotify等流媒体平台每天上传超过10万首新歌曲。你真正听过多少首歌?大概不到1000人,99%都被淹没了。如果数量达到100万会怎样?一旦达到1亿,就没有人会问了,而且即使供给增加,需求也不会增加。
当然,还有其他类型的B2B音乐,例如罐头音乐。他们的存在不是为了吸引注意力,而是为了提供一种情感氛围。线下游乐园、商场、餐厅等存在大量具有类似需求的低成本视觉内容,这种音乐有非常稳定的贸易市场和商业业态,高级制作是没有必要的。我认为人工智能在以下领域非常重要:这种音乐的影响是非常直接和立竿见影的。
目前,人工智能音乐从这个平台中获益最多,原因很简单:如果平台不需要每年向上游创作者支付高额版税,那就不需要了。平台的逻辑是简单计算下游听众的总收听时间,相当于上游的版权费用。如果其中一部分被平台制作的AI音乐所取代,则意味着支付上游版权的成本将大幅降低。当然,如果创作者明确知道的话,他们肯定会反对有人取代他们的音乐训练模式。因此,在整个AI领域,需要促进训练数据的公开透明,追踪其来源,并对训练数据进行监管。平台也需要在这方面发挥历史性的积极作用。
虽然我上面提到了一些有效的商业模式,但总的来说我认为生成式人工智能在音乐领域的发展仍然有限。
人工智能基本上由三个环节组成:输入、计算、输出。计算环节随着时间的推移不断改进,因此人类并不总是能清楚地看到进步的边界,但对于文学学生来说,输入环节总是受到人类语言的限制。人类大脑皮层70%的区域被视觉处理功能所覆盖,当语言诞生时,人类的交流系统就是通过视觉同构建立起来的。与视觉相比,人类语言和听觉的同构性很差。制作音乐是一种试图表达无边界、无形式的声学环境,而这很难用人类语言准确表达。这使得输入过程在创建和修改期间都非常低效,并且使得人类语言描述很难准确地传达给计算机。只要是文森特,粒度就不可能很小。
因此,对于相同的计算进步,文森特的视觉进步,例如文森特的照片和视频,将远远高于文森特的音乐进步。文森特音乐的局限性非常明显,因为他的描述能力太粗糙了。
作为一名音乐家,我经常被问到“人工智能真的能创造艺术吗?”我的答案是,除非有一天人工智能有不同的意图和情感,否则音乐创作的过程永远不会一样。
我第一次写歌是在20 世纪90 年代,当时我组建了一支摇滚乐队。乐队的歌曲创作其实并不是那么严格的创作过程,更像是大家一起演奏,情感与灵感碰撞,各尽其责。
后来学了古典音乐,但是音乐制作比较严谨。古典音乐的创作通常通过作曲家本人的录音和作曲来直观地表达,一个周期可以持续六个月、一年,甚至更长。
现在,当您制作电子音乐时,创建电子音乐是一组独立的过程。电子音乐可以由一个人或多人创作,但它本质上是完全基于软件的,当然也可以有硬件的辅助。您可以输入和编辑整个音乐的元素,例如旋律、音调、节奏和各种乐器,将它们分解为最小的单元。
随着我们进入电子音乐时代,音乐被分解为数字单元,为智能和生成音乐奠定了基础。当你的计算和编曲能力达到一定程度后,你自然也能涉足音乐制作了。
但人工智能创作的音乐能称为艺术吗?人工智能生成的绘画、文学、设计等,而不仅仅是音乐,可以被称为艺术吗?我们该如何定义艺术?
首先,艺术是人类独特的内容形式。第二,一切艺术都需要两个层次:技术层次和核心层次。这两个层次中,内核层次是必要条件,技能层次是充分条件。
排列和组合声音以创造旋律和和声、排列乐器以及模拟人声都是技能。
技术层面是对线条和颜色的排列和组合,创造出人类喜欢的外观。
技能级别是把古汉语词汇按照规则组合成7个、5个单词。
核心层是什么?是人的意图和情感。这两个元素存在于每件艺术作品中。目前,人工智能没有意图或情感。
您如何看待人工智能可能带来的大量“电子垃圾”?
谁应对电子垃圾负责:创造者、分销商还是观众,这是一个无休止争论的话题。
首先,我不认为观众有错。很多人批评观众审美差,因此内容也差,但我觉得这个论点站不住脚。如果你回顾人类历史的各个阶段,大多数人都不知道自己想要什么。无论任何时代、任何地区的艺术水平如何,观众的结构都是一样的。
其次,我认为分配过程必须是客观的。分销渠道发生了巨大变化,从经销商商店到流媒体。很多人认为原因在于分销环节,批评分销公司不负责任,把一切强加给他们。这种质疑也是不能容忍的。仔细想想,如果由发行公司来制定价值标准,岂不是更错了?我们不应该要求分发链接来评判我们,而应该客观、公正。按受众构成匹配分布不是问题。
我认为问题在于创作过程,这是一个非常主观、有明确标准的过程。作为创作者,无论硬件或环境如何,都必须不断努力并尽最大努力创作出最好的作品。这就是所谓的工匠精神。我相信如果是这样的创作生态和客观公正的分配机制,结果一定会不一样。
毕竟,工具是人们使用的东西。专业音乐家可以自由选择是否使用人工智能来收集素材和灵感,或者干脆将人工智能生成的歌曲作为自己的歌曲发布。
最后,我们来谈谈AI音乐的未来。
100多年前,拍照是一件高度专业化的事情,进入门槛极高。即使在50年前,拍照也需要学习如何使用专业相机并调整光圈。然后,随着数码相机的出现,智能手机同样获得了拍照的权利,任何人都可以随时随地拍照并上传到社交媒体。世界每天都会产生数十亿、甚至数百亿张照片,其结构是非常典型的权力结构。虽然少数名人和网红花费大量时间和精力拍摄了很多人都可以看到的复杂照片,但大多数普通人只是随意将它们发布到SNS上并收到数十张被某人观看的照片。我知道。
未来的AI内容将继续遵循这个结构。
未来,每个人或许都可以通过设备平台使用AI生成的音乐来表达自己的心情,但只有那些拥有更多时间、更多条件的人才能让更多人听音乐的结构不会改变。诚然,大多数人的音乐影响力仍然有限,但人工智能为我们提供了更多选择,这是一件好事。
无论你是投资者还是音乐家,人工智能正在带来翻天覆地的变化。人们总是怀着怀旧的心情,寻找每一代人的音乐,欣赏那些表达代际叛逆的音乐。
从纯粹的自然声音,到进入音乐领域的电声、窃窃私语的麦克风,再到数字时代的电子音乐,音乐范式的变化促进了音乐核心内容的变化。随着电子音乐时代的到来,AI将扮演加速器的角色。
下一个范例将是什么?你什么时候来?
我们无从得知。
当风吹来的时候,我们所做的就是听风声,看沙飞扬。
我们期待着明天的加速到来。
本文和图片来自网络,不代表火豚游戏立场,如若侵权请联系我们删除:https://www.huotun.com/game/673302.html