由埃隆·马斯克(Elon Musk)支持的OpenAI开发的以智能游戏代理形式出现的人工智能刚刚击败了世界顶级电竞玩家之一。Dota游戏的著名玩家Danil“ Dendi” Ishutin在该机器人展示了惊人的游戏技能后,连续连续输掉了两场比赛,拒绝参加第三场比赛。
绝对不是AI在游戏中第一次击败人类,最近AI击败了职业扑克玩家和世界顶级围棋玩家Lee Sedol。但是,这次却有所不同,因为比赛是在更为复杂的游戏环境中进行的。
最近,来自OpenAI的十几位研究人员一直致力于研究领域,该领域允许智能代理使用虚拟键盘和鼠标来像人类一样使用计算机。他们甚至发布了一个名为Universe的开源项目,该项目使任何人都可以在全球游戏和其他应用程序中培训AI代理。
他们研究的高潮发生在国际Dota 2锦标赛的主要阶段,这是世界上最大的电子竞技项目之一。正如研究人员团队所提到的那样,该机器人只花了一个小时的培训就学习了控制内置游戏机器人的必要技能。而且,经过两周的实时学习才能击败顶尖的人类玩家。
“在过去的一周中,我们的机器人在众多顶级专业人士的面前不败,包括SumaiL(世界排名第一的1v1玩家)和Arteezy(世界排名第一的整体玩家),”该机器人的创建者在博客中说。
Ishutin还提到了该机器人在做出某些关键决定时会毫不犹豫的,这是大多数人类玩家通常会做的-这再次证明了这种情绪在人类决策过程中会产生多大的波动。
“他的动作很疯狂,我真的很紧张。… 好。我放弃了,他太坚强了,”伊舒廷在游戏中说道。
那么,为什么这很重要?与之前的AI击败围棋冠军相比,它又如何呢?多人在线战斗竞技场游戏(MOBA)通常比具有所谓“完美信息”的游戏要复杂得多,在“完美信息”游戏中,玩家会被告知游戏中发生的一切。国际象棋和围棋是具有完美信息的游戏示例,因为每个玩家都可以充分了解棋盘上的所有数据。
与国际象棋相比,诸如Dota之类的电子竞技游戏通常包含许多隐藏信息。这就是为什么聪明的游戏代理商必须学会适应,制定攻击和技巧的策略,甚至学会欺骗对手的能力。
如OpenAI所述,其机器人每分钟动作之间的相关性可与普通人类玩家相提并论,这意味着技能的关键不是快速执行能力对游戏的重要性。
这就是为什么该计划的主要支持者之一埃隆·马斯克(Elon Musk)立即赞扬OpenAI的胜利,这项成就比Google DeepMind在古老的Go游戏中的胜利更大。
OpenAI有史以来第一次在竞争性电子竞技中击败世界上最好的玩家。比象棋和围棋这样的传统棋盘游戏要复杂得多。
大公司越来越有兴趣在游戏环境中尝试人工智能。DeepMind最近宣布与广受欢迎的《星际争霸》游戏的创造者暴雪(Blizzard)建立合作关系。他们介绍了一种为Starcraft训练机器人的新方法,并发布了一份联合研究论文,概述了强化学习应用程序的游戏环境。
这种类型的研究的目标是在不同的类游戏环境中训练智能主体,因为它们比典型的研究问题要复杂得多,并且通常包含多个子目标,因此难以为其建立智能。这就是为什么这些环境可能会真正突破研究的界限并改变我们认为从长远来看AI可能实现的目标。