人工智能接管扑克世界
为机器赢得另一场胜利。
在这篇文章中,我们将讨论叫做Plulibus的人工智能如何终于破坏了扑克中最大的挑战 - 赢得了一个多人职业锦标赛。
然而,为了帮助您更好地理解这个里程碑有多特别,我们还将向您展示:
我们不会让你久等,因为我们确信你想了解更多关于这个不可思议的故事。所以,让我们开始吧。
人工智能的又一胜利
虽然这场胜利是AI的重要里程碑,但它不是扑克演奏计划第一次设法击败扑克专业人士。即,在2017年赌场锦标赛期间AI程序名为Birtarus击败了四名职业球员的双手扑克12万人。
但是,当时,该计划的共同体创造者桑德霍尔姆图(图左)相信AI在与多个玩家同时对抗时无法达到类似的表现。
仅仅两年后,他就证明自己错了。他创造的名为Pluribus的人工智能程序赢得了德克萨斯扑克锦标赛(Texas Hold’em tournament)的冠军,在这场比赛中,该程序同时与五名人类职业选手比赛。在超过20,000手的在线扑克游戏中,Pluribus击败了15名世界顶级扑克玩家,赢得了48,000美元的虚拟奖金。每天都会从泳池中选出五名同意接受挑战的优秀人类选手。每位职业选手都在比赛中赢得了超过100万美元的奖金。
是什么让这个里程碑如此特别?
AI已经超过了两组或两名球员游戏中的人类,如国际象棋,去,跳棋和两名球员的无限扑克。所有这些游戏都是零和 - 只有一个胜利和一个失去的一面。此外,在这些游戏中,玩家可以看到所有碎片的位置。另一方面,六扑克与类似现实生活的情况更接近 - 一个玩家必须在不了解多个对手资源和决策过程的任何内容的情况下做出决定。
Pluribus计划通过对抗本身的副本来学习扑克。一开始,它播放了六球播的游戏,它只有一个人和五个独立版本的自身。后来,它继续赢得锦标赛的五个职业人类参与者在10,000手中赢得扑克和12天的比赛。虽然Plulibus并没有像Libertus那样高的胜率,但它仍然缺乏非常可敬的胜利率。
虽然有一些证据表明,两位玩家扑克中使用的AI技术将在三位运动员竞争中运作良好,但尚不清楚达到最高专业水平是否足以实现。这一事实是它对六位玩家扑克工作的事实无疑是一个值得注意的里程碑。Tuomas Sandholm说,
在这种充满虚张声势和隐藏信息的复杂游戏中,能够一次打败5名玩家为AI解决现实世界中的问题提供了新的机会
这一切顺利
为了达到这个级别,Pluribus从头开始了。它首先随机播放,但随着时间的推移,该计划稳步提高了其性能。经过一周左右,它开发了一种称为蓝图的策略,用于第一轮赌注。庞大的突破导致在六位玩家锦标赛中击败扑克专业人士来自其深度限制的搜索功能。基于可能的对手决策,此功能允许AI预测若干动作并弄清楚迄今为止的游戏的盈利策略。
许多其他扑克播放程序已经使用了类似的搜索组件,但其中大多数是设计用于零和匹配的,其中可能结果的数量有限。对抗五个对手的比赛更复杂,并且需要一个荒谬的计算内存。简单地说,在六扑克游戏中,有太多的情景来预测,基于每个玩家据说的卡片,他们每个人都认为其他玩家,以及基于这些预测的所有投注决策。
Libratus只是通过在最后两轮(四轮中的)投注中使用搜索来绕过这个障碍。尽管如此,这种解决方案仍然需要在只有两个玩家的游戏中使用100个cpu(中央处理单元)。
因此,Pluribus部署了有限深度搜索。当使用这种技术时,AI首先考虑几个下一步行动。除此之外,它还将每个模拟玩家的选择范围缩小到4种结果。与过去在游戏ai领域的超人成就相比,这种类型的改进搜索是程序需要更少的计算资源和内存的原因。具体来说,Pluribus运行在一台“只有”两个中央处理器和128g内存的机器上。换个角度来看,Deep Mind著名的AlphaGo程序运行于1920个cpu上打败了职业围棋手李世石.
卡内基梅隆大学
据德克萨斯州举行,Pluribus部署了一些令人惊讶的策略,否则它会被播放的专业人士使用。首先,它使用了不同的赌大尺寸 - 一种人类似乎很难做到。此外,该计划采用了一种人类通常避免的策略 - “Donk投注”战略。Donk博彩是一种用呼叫结束第一轮赌注的做法,并在下一轮打开下注。虽然Donk投注被视为扑克专业人士在扑克专业人士中没有意义的薄弱的举动,但是否则发现的Pluribus。
肖恩之后一位曾与Pluribus对弈的选手解释了为什么与一个程序对弈是一项如此艰苦的任务。根据他的说法,对人类来说,扑克是一种奖励你的精神纪律、一致性和专注力的游戏,而当你缺乏这三种中的任何一种时,就会受到惩罚。另一方面,AI机器人不需要担心这些缺点,这也是让它成为强大对手的原因。
没有保证
尽管Pluribus的表现胜过人类扑克玩家,但根据一种被称为纳什均衡的博弈论原理,并不能保证它总是赢。
纳什均衡出现在非合作博弈中,即每个参与者都有一系列策略,没有人能够通过实施不同的策略来提高自己的表现。虽然《Heads Up Texas Hold’em》中的纳什均衡仍然是不可战胜的,但开发者仍然需要为6人游戏变体找到一个均衡。
我们有机会吗?
杰森·莱斯是一个可能拥有更多经验的玩家,这些玩家比世界上任何其他扑克专业人士都有更多的经验,被黎巴利斯的胜利惊呆了。他声称要了解弱点的所有景点,以及利用AI缺点所需的所有技巧,但尽管他最大的努力,但仍然出现了。据他介绍,Pluribus使用了一个声音,游戏理论最优策略,只能从顶级人类专业人员看,这是意外的。为了结束他的陈述,他说他不会参加这个扑克锦标赛,其中这个AI机器人在桌面上。
许多优势和科学家认为扑克AIS可能会杀死他们试图征服的游戏。事实上,AI可能已经杀死了头上的限制。扑克就像是一款金字塔方案:它需要各种各样的技能水平来支持为大雄鹿队使用的优点。由于人类从机器人迅速学习,每个人都变得良好,技能水平变得均匀,金字塔向下坍塌,游戏模具。
最终的想法
不幸的是,对这些假设有很多绩效。生命改变的发展从根本上改变人类互动,成长和生存的方式。人工智能正在改变世界,我们所能做的就是适应并尽量充分利用它。
谈到涉及大量概率计算和诸如国际象棋或扑克的数学的游戏时,计算机将永远比我们更好。我们的大脑刚刚在这么短的时间内执行大量的数学计算。这是否意味着AI将会破坏扑克?根本没有,这只是意味着游戏会像其他一切一样进化。
你怎么看这些?机器的胜利是否标志着扑克的终结?我们将很高兴听到你的印象和想法,所以不要犹豫,在评论区开始辩论。