OpenAI Five技术梳理(Dota2)

如题所述

OpenAI Five项目是利用强化学习技术在Dota2游戏中与人类世界冠军对抗的尝试。该项目从零开始,通过自我对战学习提升,能够控制17个英雄中的任意一个,但不会使用所有物品。Dota2的观察信息主要由低维数据组成,与玩家信息有细微差异。策略网络的参数在所有英雄之间共享,输入数据大部分相同,以区分不同英雄。动作是离散的,包含主要动作、延迟、单位选择和偏移。目标选择时运用了注意力机制。

核心算法为Proximal Policy Optimization(PPO)。项目使用分布式PPO与Generalized Advantage Estimation(GAE)结合,一部分CPU和GPU用于收集数据,另一部分GPU用于优化,参数更新存储在Redis服务器上,实现动态调整。网络结构在文中展示,但实际中整个网络被复制了5份以控制5个英雄,并设有一个“cross-hero pool”帮助英雄间信息交流。训练过程持续180天,分布在10个自然月内,包括了网络结构调整、观察/动作空间调整、环境调整等动态训练策略,确保训练过程中的平滑过渡。

奖励设计方面,引入了密集奖励、零和奖励、游戏时间加权奖励以及团队精神奖励。密集奖励详细考虑了各种情况,确保全程零和。为了鼓励探索,对中立生物(如Roshan)的血量进行了随机化,以减少死亡惩罚,促进对Roshan的挑战。时间加权奖励调整了后期奖励的膨胀,团队精神奖励则在初期设置较小时有利于快速学习。

总结:OpenAI Five的成功离不开精心设计的脚本、自我对战、奖励机制、PPO算法及其手术优化(surgery),以及引入的动态调整策略,如minimax算法用于英雄选择。项目报告详尽地涵盖了开发过程中遇到的各种问题和解决方案,对后续挑战者具有极高的参考价值。报告中还提到了手术优化方法的理论依据和实际效果,以及价值网络与策略网络的共享策略,引发了一些讨论。
温馨提示:内容为网友见解,仅供参考
无其他回答

OpenAI Five技术梳理(Dota2)
OpenAI Five项目是利用强化学习技术在Dota2游戏中与人类世界冠军对抗的尝试。该项目从零开始,通过自我对战学习提升,能够控制17个英雄中的任意一个,但不会使用所有物品。Dota2的观察信息主要由低维数据组成,与玩家信息有细微差异。策略网络的参数在所有英雄之间共享,输入数据大部分相同,以区分不同英雄。...

OpenAI-Five 模型详解
OpenAI-Five是OpenAI开发的Dota2 AI,在6月5日以巨大优势击败了人类半职业选手。其详细训练模型揭示了复杂性远超AlphaGo等前代AI。在Dota2与围棋等游戏最大的不同在于其丰富的内部数据类型和语义。模型顶层结构包括19个固定数量的相对独立输入特征,代表全局状态,以及数量不定的输入,涉及游戏中的数据。...

Dota2团战AI击败人类最全解析:能团又能gank,AI一日人间180年
在Dota2的世界里,AI的新里程碑出现了:OpenAI研发的人工智能战队OpenAI Five,首次在5v5的团战中击败了人类玩家。这场胜利不仅象征着技术的突破,也引发了对AI能力深入剖析的必要。OpenAI Five的强项首先体现在团战策略上。面对装备和等级更高的人类团队,AI凭借23级英雄的智慧,用“EUL的神圣法杖”定住...

首次!AI 组队在Dota 2五对五团战中战胜人类,协作型人工智能的里程碑式...
OpenAI Five只能在有限条件下打Dota2。他们选择的5个英雄是Necrophos、Sniper、Viper、Crystal Maiden、Lich。一些决策过程是硬编码的,比如在商店买哪些物品,以及选择用游戏积累的经验值提高哪些技能。此外,游戏中一些决策棘手的操作也被禁用,比如隐形和召唤。这些技能可以让玩家拥有观察远方的功能,几乎是高级...

人类奋起反击!Dota2顶级淘汰赛OpenAI开场惨败!
但不再进一步学习。尽管底层算法简单,但在没有人工数据的情况下,OpenAI Five从简单的操作中学习到了专业级的策略。OpenAI DOTA的进化时间线显示,从2016年选择Dota作为目标,到2018年成功在TI8中对战现役职业玩家队伍paiNGame,只用了不到2年的时间,从1v1到5v5的挑战,OpenAI的AI技术取得了显著进展。

Dota2冠军OG如何被AI碾压?OpenAI累积三年的完整论文终于放出
Team OG,作为Dota2的世界冠军战队,在面对人工智能OpenAI Five时,展现出了极强的实力。但在五个人类组成的战队与OpenAI Five的较量中,结果却是0:2,两局加起来,OG甚至只推掉了两座外塔。然而,这还不是AI的强大所在。最新出炉的AI,名为Rerun,面对碾压OG的OpenAI Five,胜率高达98%。这份研究...

最终决战!OpenAI将挑战Dota2最强战队、TI 8冠军OG
OpenAI宣布,其游戏AI“OpenAI Five”将在4月13日与人类进行最终对决,对手是Dota 2世界冠军团队OG。尽管去年8月在TI8国际邀请赛上,OpenAI连续输给paiN和中国Dota届元老组成的战队,但OpenAI并未因此放弃。这次直接选择与TI8冠军团队交手。看来在最近6个多月的时间里,人工智能又学会了新的技术?这次...

dota2人机ai哪个版本强dota2人机哪个厉害
在Dota 2的模式中,OpenAI的版本被认为是最强大的。OpenAI团队开发了一个名为OpenAI Five的AI系统,它在与人类团队对抗的比赛中展现出了惊人的实力。OpenAI Five能够通过自我学习和大量的训练来提高自己的技能,它具备出色的团队合作能力和高超的战术决策能力。这使得OpenAI Five成为Dota 2 AI模式中最具...

AI被人类选手“虐杀”!DOTA2顶级职业赛人类战胜AI!
在DOTA 2全球顶级赛事Ti8淘汰赛第三日的比赛中,OpenAIFive对阵Pain Gaming(PG)战队。这场BO1比赛以PG的胜利告终,OpenAIFive在首次以5V5形式对阵人类职业选手时,未能展现出其在游戏领域的统治能力。比赛开始不久,PG便通过诡计之雾拿到OpenAIFive的潮汐猎人首滴血。随后,OpenAIFive在下路一塔旁边插的...

怎么挑战dota2openai
挑战Dota2 OpenAI的步骤:1. 了解OpenAI的基础知识和技术。2. 选择合适的挑战方式。3. 制定并执行挑战策略。4. 分析并改进自己的技能。具体解释如下:一、了解OpenAI的基础知识和技术。在挑战Dota2 OpenAI之前,需要对其背后的技术和策略有深入的了解。OpenAI是一个人工智能研究领域的领先者,其开发的模型...

相似回答
大家正在搜