dota2人类英雄,dota ai

北京时间8月6日凌晨,OpenAI的AI系统与人类又进行了三场Dota 2比赛,最终以2-1击败了人类队。

本次比赛旨在测试AI系统是否具备与TI8(2023 Dota2国际邀请赛)顶级职业队伍抗衡的能力。看来OpenAI又要开始新的征程了。

此次代表人类的是Blitz、Cap、Fogged、Merlini和MoonMeander,他们都是欧美Dota圈的知名主播、解说、前任和现任职业选手。其中,Merlini是Dota 1 Zeus冠军头衔的持有者。经典的“绕林三杀”获得了无数玩家的好评。据OpenAI官网显示,他们的平均水平高于99.95%的Dota2玩家,但五人从未一起训练过,默契有限。

根据DOTABUFF的数据,他们的天梯排名都出现了异常。其中排名最高的玩家是Complexity活跃成员MoonMeander,美服排名第40位,排名最低的caster美服排名第1054位。

与一个多月前的5V5镜像英雄Dota2大赛不同,这次OpenAI不仅扩大了英雄库,允许双方以随机招募模式(无禁令)选择英雄,而且AI的反应速度也有所提高。系统的反应速度接近人类,之前许多对人类不利的限制也被消除。

绘画比赛限制

相比之下,最大的变化是新规则允许玩家防御、隐身(使用袖剑和欺骗之雾等)以及与肉山战斗。解除这些限制可以让人类获得更多的信息和发展空间,并使用狡猾的侦察守卫来获取更多的信息并弥补技能连接错误和反应时间慢的弱点,这意味着你可以使用更多的战术和策略,例如。

图| OpenAI 五人击败肉山

这也意味着AI在短短一个多月的时间里就学会了这些英雄、策略以及相应的对策。此前,一些评论者和Reddit论坛上的大多数声音都认为,掌握这些复杂的游戏机制还有很长的路要走,至少需要一两年的时间。然而,人类被人工智能打脸的事并不少见。

正式比赛前,AI系统与5名当地观众进行了一场热身赛。仅仅13分钟后,观众队就以4分21秒之差落败。 AI在游戏中表现出了强烈的攻击压制欲望,跳塔击杀、绕塔gank,仅用了10分钟就到达了TP。你控制一个人类玩家并做你想做的事。

图丨首场比赛阵容

不过,随着正式比赛中球员水平的显着提高,这种情况得到了改善。第一局对线阶段,人类玩家的最后一击与AI相差不远,AI的冲塔欲望也明显降低,因为玩家对走位和耗血更加谨慎的抑制。与此同时,人类在借鉴野生技能方面的优势也压倒了人工智能。这是第一次由人类控制的英雄必须原地转圈。

但美好的时光并没有持续多久。由于AI的技术和对血量的精确计算,人类玩家不仅在小规模战斗中没有优势,甚至可以被三个玩家击败。小团体多次被摧毁,甚至被人工智能击败。火枪手们绕过森林进行反击。此后,AI开始接管脑力和经济优势,常常展现出非常明显的群体晋级策略,有着杀人夺塔的“完美节奏”。

影魔创造出藏刀后,人类队伍稍微稳定了局势,并通过一些成功的捕获和交换减缓了AI的杀戮节奏。此时,AI并没有像传统机器人那样表现出无知群体的进步,而是开始同时对2-3人进行小规模抓捕。以补充发展。不难看出,AI系统实际上正在塑造其对游戏的“理解”,意味着它可以在不同的情况下做出不同的选择。

此后,事态继续失控。毕竟,面对AI凶猛的Gank和集群,火枪狙击手和直升机高射炮根本无能为力。立即地。当AI队伍拿下上下路高地时,人类死灵术受挫,但他们第一次选择了购买生命。事实上,AI团队就像人类玩家一样,选择了撤退,以寻找更好的东西。直到下一次。随后,当他们再次攻击高地时,人类神牛一跃而下,被莱恩击败。这不仅预示着球队战局的崩溃,也意味着高地的丧失,决定了比赛未来的走向。最终,人类无力抵抗,在24分钟内攻击了GG。

第二场比赛的整体趋势与第一场非常相似,人类团队试图利用隐藏的倒钩来获取更多信息,增加了不确定性,并让AI的决策更加困难。虽然我们取得了一些初步成果,但AI的整体思路没有改变。利用群山压制人类兄弟的成长,积极游走,变线,改变TP来消灭击杀和推塔。人类玩家。

隐刺、神牛、影魔的配合产生了一些积极的效果,他们多次成功击败了AI枪械和辅助武器,但当人类追求胜利时,AI总是找到了击败人类的突破口。杀死。值得注意的是,在第一场比赛中,人类玩家由于游戏滞后而暂停了比赛,而在第二场比赛中,AI系统也暂停了一次,这似乎是由于AI学习人类行为所致。证明存在,尽管我无法理解其背后的原因。

比赛进行到15分钟左右,人类中路失利,局势再次被AI掌控。最终,AI队用时24分钟赢得了第二局比赛。

在2-0击败人类队伍后,OpenAI首席技术官Greg Brockman宣布:“我们的系统已经准备好在TI8上与顶级职业队伍较量!”

图片丨OpenAI CTO推文

接下来的第三场比赛对于拯救人类最后的尊严来说意义重大,因为双方都是由观众选择的,而AI则独自负责游戏中的操作。最后我们可以看到,OpenAI对于观众选择的阵容非常“不满意”,赛前预测的胜率只有2.9%。

第三场比赛的走向也证明了OpenAI赛前的预测是正确的,尽管没有前两场比赛的流畅和完美节奏。比赛初期,AI控制的斧王选择出双盾,与三名队友(不包括隐刺)强行统治人类优势线,但效果依然不理想。小鱼双核没有设备支持。效果有限。

在失去分支知识和熟悉的节奏后,AI英雄往往会在10-25分钟内被困在地图上的不同位置,无法独立作战并组织有效的反击、防御,漫游也不再可能。然后游戏就进入了更加人性化的节奏,我们也看到了很多莫名其妙的动作,比如鱼人随机使用暗影之舞,女王放大了死亡先知,后者被我的风之杖吹走了。 Swin和Axe在敌人的塔下徘徊。 AI系统给了游戏绝望的1%胜率。

33分钟,人类在BKB直升机面前攻击AI中高地,但AI没有太多有效抵抗就被击败。最终,人类恢复了平静,保留了尊严。与此同时,当前人工智能系统的缺点也变得显而易见。这意味着他们还没有学到足够的知识来有效应对逆风情况。

事实上,OpenAI 承认,在击败业余人类团队之后,在项目开始时,它并没有想到毫无根据的强化学习会达到如此高的水平。

图丨OpenAI五网架构图

OpenAI的Dota 2人工智能系统被称为“OpenAI五号”。根据之前的OpenAI 论文,该系统基于机器学习和神经网络技术,由256 个GPU 和128,000 个CPU(谷歌云平台)支持,并具有每天24 小时运行的独立对抗性优化(PPO)算法的接近策略。每天的训练量相当于180年的比赛时间。

整个训练过程中没有使用人类玩家的数据,也没有搜索或观看人类游戏的视频。这一切都是自学成才的。然而,目前所有的英雄装备和技能选择都是人类编写的脚本,AI每场比赛随机选择一套。

由于AI系统需要“控制”五个英雄,OpenAI为每个英雄分配了一个长短期记忆循环神经网络(LSTM RNN网络)。网络之间没有直接的沟通渠道,仅在同一游戏内,五个网络通过“团队精神”超参数值相互协调。该参数在0到1之间,用于调整个人和团队之间的注意力分配。最终将其设置为0.97,以确保每个网络优先考虑其团队的最大利益。

在训练过程中,OpenAI 团队使用奖励和惩罚机制来定义每个英雄将获得的“分数”。完成最后一次攻击或摧毁塔等行为被视为奖励,死亡被视为惩罚。

有趣的是,GitHub上的开源奖励机制文档指出,击杀敌对英雄的百分比是-0.6。这是因为“杀戮”所获得的金钱和经验会增加很多点。换句话说,行为本身就被设置为一种“惩罚”,减少其带来的分数提升,防止AI过度追杀。

图丨AI系统计算个人奖励百分比

上述机制不仅印证了Dota 2的本质不是“杀戮”而是“推塔”,更重要的是理性的决策机制与短期盈利和长期收益之间的博弈。兴趣。

本质上,通过强化学习训练的人工智能系统不断搜索和计算“最佳解决方案”,该解决方案可以是局部最优解,也可以是全局最优解。游戏的细节表明,AI系统实际上放弃了眼前的利益,而是考虑形势和整体发展。

因此,OpenAI认为“我们的系统确实是长期优化的”。

从大局来看,人工智能系统所表现出的战术增长、沟通、协调和权衡可以很容易地概括为“实现最终目标的长期规划”。无论是Dota 2的OpenAI Five还是Go的DeepMind Alpha Go,人工智能都会执行一些人类难以理解的动作,但其中很多最终都是完全无用的,这是必要的操作。人工智能系统仍在从头开始研究并逐步完善。然而,无数类似的行动已被证明最终带来了胜利并激励了人类。

国外评论员Purge和Pixel在游戏过程中多次提到,人类玩家可以从AI身上学到很多技能,比如分享和交流仇恨。这也是OpenAI系统的正确使用,虽然目前人类还不了解AI系统的套路和策略,但我们相信,通过反复的训练和实战,对抗AI的能力一定会提高。提升。这可以用来提高人类玩家的表现。

正如OpenAI联合创始人兼首席技术官(CTO)Greg Brockman所说,OpenAI也是人类智慧的果实,因此“无论结果如何,赢家都是人类”。

本文和图片来自网络,不代表火豚游戏立场,如若侵权请联系我们删除:https://www.huotun.com/game/665966.html

(0)
上一篇 2024年6月4日
下一篇 2024年6月4日

相关推荐

  • 和平精英实名认证怎么改成成年人?

    和平精英实名认证怎么改成成年人? 实名认证是改不了,换账号吧。 和平精英怎么实名认证? 和平精英实名认证方法: 1.第一步我们首先需要知道和平精英实名认证的话,如果是qq登录就用qq进行实名认证,如果微信登录就用微信实名认证 2.第二步这里以qq登录为例,点击qq钱包->设置 3.第三步进去之后,点击实名认证 4.第四步进去之后,可以进行实名认证,根据…

    游戏快讯 1小时前
  • 刺激战场皮肤在和平精英里能用吗?

    刺激战场皮肤在和平精英里能用吗? 1. 不能用。2. 因为刺激战场和和平精英是两款不同的游戏,它们的游戏系统和皮肤设计都是独立的,所以刺激战场的皮肤无法在和平精英中使用。3. 尽管两款游戏都是吃鸡类游戏,但它们的开发公司和游戏平台不同,所以皮肤等游戏道具也是独立的。如果你想在和平精英中使用皮肤,需要在和平精英游戏内购买或获得相应的皮肤。 和平精英怎么重返战场…

    游戏快讯 3小时前
  • 和平精英如何获取永久套装?

    和平精英如何获取永久套装? 目前还不能获得永久版的,只有30天使用权。;和平精英;完美勇士套装是属于期限套装,以后会不会上架或者做活动放出来就不知道了。 和平精英永久买皮肤真的? 是真的,和平精英可以永久买皮肤,一次性购买,永久使用 免费领皮肤永久和平精英? 那也只是骗人的而已,连最起码的黑色伏地魔都要600个服饰币,可以免费领永久的皮肤都是假的,除非你有申…

    游戏快讯 4小时前
  • 和平精英如何画车皮? 和平精英手册如何画?

    和平精英如何画车皮? 车皮可以通过以下步骤进行绘制:1. 打开和平精英游戏,在游戏主界面进入“武器”选项,选择需要绘制车皮的武器,点击“皮肤”选项;2. 在皮肤选项中,选择“全部”,之后会弹出所有该武器的车皮和皮肤,选择一个自己喜欢的车皮;3. 点击该车皮后,可以在下方看到该车皮的款式,还可以选择自己喜欢的颜色;4. 点击“图案”选项,这里提供了多种图案,可…

    游戏快讯 5小时前
  • 和平精英下赛季更新内容?

    和平精英2022年6.29更新内容一览 版本更新奖励 6月29日-7月4日活动期间更新版本即可获得: 科学之轮宝箱x1、金币x3888、双倍金币卡x1(3日)、双倍经验卡x1(3日)。 主要更新内容 全新版本主题玩法 – 科学之轮 活力四射的夏日又到啦!这一次,冒险世界将以科技为主题,打造全新的战斗区域和互动玩法!特种兵们,还等什么?快来一决高下…

    游戏快讯 7小时前