骨折模型的结论数学,骨模型怎么做

文| 光锥智能,作者| 王一苏

时隔10年,国内云厂商再战!

近一个月来,国内云厂商又开始对大型号进行新的降价。这意味着AI竞赛不再像军备技术竞赛那么简单,各大厂商也在考虑如何盈利。

这场价格战涉及火山引擎、阿里巴巴,以及智普人工智能、面墙智能等明星创业团队。看似各家公司都在降价,实则都是想通过降价来快速抢占市场,快速将产品商业化。

从大卷型号技术到卷价格

从任何人的角度来看,各大厂商都有很多业务,所以即使在AI业务上出现亏损,也可以在其他业务上弥补,所以他们降价的信心和实力可能是有的。大机型价格战的煽动者是明星创业团队——智普AI。

5月11日,智浦AI大模型开放平台将新注册用户额度从500万枚提升至2500万枚,并推出个人版GLM-3 Turbo模型产品的抢购价格。 10000个代币的价格从5元/100元下调至100万个代币,降价5倍。但仅此还不够。 GLM-3 Turbo Batch批处理API也便宜50%,售价为1元/200万个代币。

四天后,火山引擎宣布重磅消息,宣布豆宝Pro 32k 机型售价为每1000 个代币0.8 美分,比行业价格便宜99.3%。此外,目前豆宝Pro 128k型号的价格为每1000个代币5美分。千枚代币。相比行业机型,价格降低95.8%。

当这个消息公布时,整个AI界都不平静了。有人说,火山发动机迎来了大型车型的“厘米时代”。

以主力型号32k窗口为例,如果选择国内型号,则有可能从GPT购买2,400个代币。如果您使用开源Llama 自己构建它,您将获得大约30,000 个代币。然而,通过豆袋模型,你可以用1元钱获得125万代币。这个概念是什么?很多人可能都读过《三国演义》。这相当于750,000 个单词,相当于3 本书,尺寸为《三国演义》。

与其他较大的模型相比,火山引擎更便宜而且几乎免费。随着火山发动机价格的下降,可以说大车型的价格战已经达到了高潮。

火山引擎发布会两天后,腾讯集团高级执行副总裁兼云与智慧产业事业群CEO唐道生向腾讯云生成分享了混元大模型的技术、性能、安全性、使用门槛等价值。 AI行业应用峰会属于底层功能,但定价并未公开。不过,根据腾讯云官网介绍,混元大模型为首次用户提供文本生成模型的10万代币免费试用,有效期一年。关于代币资源包的价格,窗口大小为32K 的hunyuan-standard 模型和hunyuan-pro 模型的模型推理输入价格分别为0.0069 元/1,000 代币和0.069 元/1,000 代币,公开示例均为6.9%降价。

与之前相比,价格已经大幅下降。根据腾讯云官网5月14日更新的计费信息,此前混元大模型标准版(混元-标准前身)和高级版(混元-Pro前身)的模型推理输入价格分别为0.012。元/1000个代币和0.12元/1000个代币。

阿里云的降价策略在一些主要厂商中尚不明确,但今年2月29日,其发出了可以说是阿里云历史上最大的降价信号,超过100家企业参与了此次降价减少做。 产品及产品规格超过500种。其中,云服务器ECS下降幅度高达36%,对象存储OSS下降幅度高达55%,云数据库RDS下降幅度高达40%,这三款产品成为用户使用频率最高的产品。

翻看阿里云的降价清单,主要降价的是传统云计算产品,但不包括GPU AI训练、推理算力等大规模模型。但云和大机型的发展是相辅相成的,而且在大机型的价格竞争中,可以推测阿里云乃至更多的大机型厂商未来很可能进入市场,每家公司的节奏都不同。

回顾OpenAI过去一年的活动,降低价格似乎是其首要任务。自去年以来,OpenAI已经四次降价。在刚刚结束的春季大会上,OpenAI发布了其最新型号GPT-4o,不仅性能显着提升,而且价格也降低了50%。

大车型价格竞争的序幕已经拉开。

价格竞争的目的是什么?

目前,国产大型车型的价格竞争正在加剧。

有人会问,“大车型是一个高投入、低产出的行业,为什么会出现价格竞争呢?”

结论很简单:“加速商业化”。

从去年下半年开始,大模型开始从“滚动大模型技术”向“滚动大模型应用”转变。 2024年,商业化和实际应用将是各大模型公司的主旋律。

根据最新的《中国大模型中标项目监测报告》,今年1-4月大型模型相关招标统计值达到2023年公布金额的77%左右,包括政府事务、金融、商业、能源、教育、交通等。都参与其中。我们看到各行业的企业对大规模模型应用的需求快速增长。

为什么你如此热衷于将其商业化?

有两个原因。首先,大型车型的研发成本越来越高。众所周知,计算能力一直是国产大型模型发展的制约因素。另一方面,就目前全球算力技术而言,美国近乎垄断,占据全球算力市场近90%的份额。相比之下,中国的算力短缺问题日益严重。

据相关数据显示,目前我国算力需求量约为每年1.5亿台,而我国算力供应量仅为每年3000万台,每年相差1亿台,占比为10%。世界的计算能力。差距是80%。随之而来的是,算力租赁服务的普及程度也在不断提高。其中,冰基科技、中北通信、惠纳科技等公司宣布大幅提高算力服务费,导致大模型研发成本进一步上升。

在巨大的成本压力下,各大模型厂商需要加紧努力,寻找产品商业化的途径。

其次,尽管大规模建模技术已基本部署,但通用模型仅具有通用知识,无法解决特定行业特定场景的实际问题。经过一年的技术竞争,很明显我们已经到了验证阶段。

国内企业纷纷出手,加速大型车型的商业化进程。目前大规模模型商业化主要有两条路径:API调用和私有化部署。

API调用是最常见的实现方法。智普AI自主研发的第四代大基础模型GLM-4的赎回价格仍然是0.1元/1000个代币,100万个代币的价格相对较低,为100元,但Qwen-. 72b-chat的赎回价格也是0.02元/1000个代币。 OpenAI 的GPT-4 Turbo 的输入/输出价格分别为每百万代币10/30 美元。

短期来看,成本并不高,但对于需求量大的用户和行业来说却不太友善。

私人安装成本更高。截至目前,国内尚无厂商披露训练大型模型所涉及的具体成本。不过,不少业内人士表示,大型车型的研发成本远高于预期,往往要花费数千甚至数百美元。计算“数百万”。

华为大模型负责人田奇曾表示,开发和训练大模型一次的成本约为1200万美元,这对于技术先进的公司来说是一笔巨大的投资,这表明训练大模型的成本非常高。

百川智能创始人兼CEO王小川也表示,每1亿个参数的训练成本为1.5万到3万元。因此,千亿参数模型的一次性训练成本预计在30-5000万元之间。 Anthropic 首席执行官Dario Amodei 还预测,未来两年该模型的成本将达到100 亿美元。

显然,API调用和研发的高昂成本阻碍了人工智能的商业化。久而久之,大型模型就成了富人的玩物,永远无法实现大规模商业化。

而价格竞争成为实现这一目标最直接、最快的方式。然而,并非所有公司都可以参与。因为只有把大车型的研发成本降到最低,才有降价的空间和资金。

前面提到,大模型最大的研发成本就是算力,因此很多厂商往往通过提高大模型的训练效率、降低推理成本来降低成本。

中国工程院院士郑为民曾做过这样的计算,在训练大模型的过程中,70%的成本花在了算力上,95%的成本花在了推理过程上。能力。很明显我们为什么要对逻辑如此大惊小怪。

例如,微软在Microsoft Build 2023 上宣布了一款支持GPT-3 的AI 超级计算超级计算机。这使得训练大型模型的效率比其他平台高16 倍,从而减少时间和风险成本。

国产大车型也不例外。从2.0版本开始,盘古大规模模型尝试使用稀疏+密集的架构来降低训练成本。发布一个月后,文心一言通过技术措施,将大型模型的推理性能提升了近10倍,推理成本降低至原来的十分之一。

阿里云统一大规模模型根据小规模模型的数据分布、规则、比例等研究如何在大参数规模下提升模型功能,并对底层灵君集群的训练进行了30%的优化,提高了模型训练效率。稳定性提高了15%。

腾讯选择了与百度和阿里巴巴不同的道路,多次升级其机器学习框架Angel,一个可以将大型模型的训练效率比主流开源框架提高2.6倍的训练和推理框架现在已经成为可能。千亿次模型训练可节省50%算力成本。

在训练框架方面,腾讯自主研发的机器学习训练框架AngelPTM可以加速和优化预训练、模型微调和强化学习的整个过程,使其能够以更少的资源更快地训练大型模型。腾讯推出大规模模型推理框架AngelHCF。与行业主流框架相比,它通过扩展并行功能提供更快的推理性能和更低的成本。

云厂商露出獠牙,大型赛车模型商业化

观察发现,阿里巴巴、腾讯、字节的商业化路径本质上是一样的:“迭代通用模型+构建完整的生态系统+开发创新AI产品的能力”,可见侧重点也不同。

持续迭代大模型的能力是大模型商业化的前提。

去年以来,国内几大厂商不断迭代大模型的功能,而百度在去年3月份就抢先发布了文信大模型,目前正在迭代文信大模型至4.0版本。语言模型。继阿里巴巴之后,同易钱文的大模型于去年4月发布,经历了2.0、2.1,目前已经到了2.5版本。

腾讯是BAT公司中最新的一家,混元于去年9月出现。此后,腾讯并没有像前两个版本那样迭代新版本扩大话语权,而是通过技术实力展示了实用性。机器学习框架Angel、机器学习训练框架AngelPTM、大模型推理框架AngelHCF升级等等。另外,腾讯前段时间开源了文森图的大型模型,通过这一系列动作,包括后续文森视频功能的升级,大型模型已经渗透到千个行业。

字节跳动是最特别的公司,短短一年时间就将豆袋模式从1.0带到了3.0。从Volcano Engine今年发布的豆袋模型家族来看,不仅包括Pro和Lite这两款热门模型,还包括7.0。已发布的功能模型涵盖角色扮演、语音识别、文本转语音、语音播放、Vincentian 图形等。这表明火山引擎未来将渗透到各个行业的各个场景。

众所周知,调用量的大小直接影响模型的有效性。对此,目前文信大机型日调用量已达2亿次,同款大机型也突破1亿次调用。字节豆宝模式日调用量达到1200亿代币(约1800亿汉字)。

强大生态加速大机型商业化。

从生态建设的角度来看,包括百度、阿里巴巴、字节火山引擎等在内的几大厂商都在走同样的道路,打造大型模型平台——。它不仅提供自己的模型服务,还与大型第三方开源平台集成。一种方便客户按需接送的模式。其中包括百度智能云千帆大模型平台、阿里巴巴的百联平台、腾讯元气、火山引擎的方舟平台等。

加快大型车型普及,拓展商业化市场空间。阿里巴巴于去年8月开源,此后推出了8个参数规模从5亿到500万的大规模语言模型,走的是“全模式、全规模”的开源之路。开源。 1100亿。其中,0.5B、1.8B、4B、7B、14B等小型型号针对端侧设备开源,72B、110B等大型型号针对企业级用户开源。此外,统一还开源了视觉、音频、代码和混合专家模型。

阿里巴巴的开源可以追溯到2023年。于是,在大规模模型泛滥的前一年,阿里云完成了ModelScope社区的建设。当社区推出时,阿里巴巴使用了300 多个先前开发的模型。所有高质量模型都是开源的。周敬仁还表示,Moda社区平台不断拓展和建设,平台上优质开源模型总数超过4500个,开发者数量超过500万。

和阿里巴巴一样,腾讯在大规模模型商业化的竞赛中也选择了开源道路。前段时间,腾讯云全面开源了混元文生图模型。 “过去,在没有大模型时代的时候,我们开源了很多项目。大模型时代的开源,”腾讯混合模型应用负责人张峰说,“这个决定是。”这是我们与腾讯联系的结果。”过去六个月的客户互动。 ”

然而,最先进入市场的百度却一直保持着闭源的做法。百度认为,闭源大规模模型能够比开源大规模模型获得更好的性能和更低的成本,有助于AI应用生态的蓬勃发展。

AI将重塑自主产品,成为各大厂商大机型商业化的第一家。

目前,百度已完成百度文库、百度搜索、百度地图、如流等业务的AI重构。阿里巴巴全面升级了阿里巴巴集团的核心产品,包括钉钉、高德地图、闲鱼、饿了么、优酷、盒马、淘票票、天猫、淘宝。

字节还推出了内部赛马系统,抖音、剑影等50多个业务部门也开始自主探索AI。去年,除了基于大豆宝模式的旗舰豆宝App外,还推出了互动娱乐应用“猫盒子”以及星慧、极萌等AI创作工具。

腾讯作为大模式中最谦虚的,在产品方面尤其谦虚。秉承产业实用性原则,腾讯自去年9月推出混元以来,一直将推动内部产品的AI转型作为重点挑战。目前,混元的规模化模式已在腾讯内部600多家公司和企业落地。设想。其中包括企业微信、腾讯会议、腾讯文档等“三大师合一”产品,以及腾讯畅享、腾讯电子签名、腾讯问卷、腾讯云AI码助手等协同SaaS产品。

加快大车型产业化和商业化最后一公里。

无论是通用模型还是行业模型,最终的实现都是为了解决特定行业或场景下的实际问题。当然,行业选择也有交叉和不同方向。

基于文信模式,百度将主导数字政务、金融、工业、交通四大重点行业解决方案的重构,并借助腾讯云TI平台支持数字政务、金融、工业、媒体、文旅、政府关系、媒体、教育等10个行业提供50多种解决方案。同时,腾讯云联合17家各行业生态合作伙伴推出“腾讯云产业大模型生态计划”,共同推动产业领域大模型的创新与落地。

阿里巴巴去年还发布了八个大型行业模型,涵盖金融、医药、法律、编程、个性化创作等领域。

据了解,火山引擎已与吉利汽车、长城汽车、捷途汽车、赛勒斯、世纪汽车等20余家厂商建立了大规模的车型生态联盟。同时,我们与OPPO、vivo、荣耀、小米、华硕等终端厂商建立了智能终端大机型联盟。由此我们可以推断,火山引擎很可能会在这两个行业占据领先地位,并随着成熟而渗透到其他行业。

结论

一年后,大车型的竞争已经从技术本身转向大车型的商业化阶段。

与大型模型的研发类似,大型模型的商业化并不是一件容易的事。前者需要更多的技术和资本来考验,而后者则必须建立在前者的基础上,并基于不同的行业和不同的业务场景。对大型模型进行微调,提供真正满足您企业需求的大型模型服务。

目前,各大车型厂商纷纷亮剑,但这只是开始,很可能各方还将继续角逐,重点关注如何加快大型车型的落地。大型车型也将迈上新的发展阶段。

本文和图片来自网络,不代表火豚游戏立场,如若侵权请联系我们删除:https://www.huotun.com/game/680097.html

(0)
上一篇 2024年6月4日
下一篇 2024年6月4日

相关推荐

  • 和平精英墓地有僵尸吗?

    和平精英墓地有僵尸吗? 和平精英沙漠墓地是没有僵尸的。但是很快就会上线暗夜危机,暗夜危机里面是有僵尸的。 和平精英沙漠圆明园位置? 1 圆明园位于北京市海淀区中关村科技园区西区北侧。2 在和平精英游戏中,沙漠地图上的圆明园位置在地图右下角,靠近沙漠区域。3 圆明园是一座具有历史意义的皇家园林,游戏中的圆明园位置可以作为玩家们的战略据点,可以利用其周围的建筑物…

    游戏快讯 45分钟前
  • 和平精英蓝色房子空投怎么开?

    和平精英蓝色房子空投怎么开? 首先我们开局要找到一个男房子的位置,首先我们需要足够的武器和一个车辆配置这次我们进入买房子的时候,要击杀机器人,击杀机器人会掉落资源,然后在仓库的左右两边会有电闸提示我们根据提示拉开电闸后,他会从那个工作台将空投用出来,我们就可以获取里面的物资了。 和平精英怎么扫描空投? 和平精英按以下方法扫描空投 方法一:当天空出现扔空投的飞…

    游戏快讯 2小时前
  • 《小跳蛙》的歌词? 小跳蛙歌词含义?

    《小跳蛙》的歌词? 《小跳蛙》 作词:彭钧,李润 作曲:彭钧 演唱:青蛙乐队 快乐池塘栽种了,梦想就变成海洋 鼓的眼睛大嘴巴,同样唱的响亮 借我一双小翅膀,就能飞向太阳 我相信奇迹就在身上,啦 有你相伴 leap frog,啦 自信成长,有你相伴 leap frog 快乐的一只小青蛙,leap frog 快乐的一只小青蛙,leap frog (rap)快乐的…

    游戏快讯 3小时前
  • 和平精英怎么拍摄自由镜头?

    和平精英怎么拍摄自由镜头? 1、找一个适当的拍摄位置,避免影响图像画面的杂音和光线,保证图像拍摄效果。2、选择遥控器或者手动拍摄技术,手持自由镜头,走动时保持光稳定,慢慢缩小镜头,以得到更加梦幻的效果。3、尽量利用横向和纵向运动轨道,可以从低空中从上方拍摄,也可以从高空中从下方拍摄,搭配不同的景深,更能凸显镜头的效果。4、尽量发掘视频中隐藏的静态画面,在某个…

    游戏快讯 5小时前
  • 和平精英开车有震动? 和平精英怎么开震动?

    和平精英开车有震动? 是有的。只希望你打开设置,找到震动模式。开启即可。具有开车震动。 和平精英怎么开震动? 桌面下滑,然后搜索游戏(应用)助手,进入游戏助手,点击右上角—设置—开启。就行了 和平精英开了震动却没有震动? OPPO手机是可以设置和平精英震动的,只需要在和平精英游戏中的设置中,选择打开震动即可。 斗鱼和平精英如何解除绑定? 1、首先打开斗鱼直播…

    游戏快讯 6小时前