卡内基梅隆大学(Carnegie Mellon University)开发的人工智能软件Libratus在为期20天的马拉松比赛中击败了世界上最优秀的四名德州扑克手,这标志着人工智能(AI)向前迈出了一大步。
经过20天的比赛,总计12万手,Libratus在周一以总计1,766,250美元的筹码领先于职业选手结束了比赛。
职业扑克手杰森·莱斯在昨天上午的新闻发布会上说:“我对扑克的水准印象深刻。”他和其他三位扑克手一样,是德州扑克的专家。“他们设计的算法比我们玩得更好。我们以寻找战略中的弱点为生。这就是我们每天都在做的,当我们无限制地玩heads-up游戏时。我们试了所有可能的方法,但还是太强烈了。”
莱斯输给了人工智能,损失了价值880,087美元的芯片。另一位玩家周智明(Jimmy Chou)在筹码上输给了Libratus,损失了522,857美元。
“这可能是我一生中最具挑战性的经历,”他说。
来自苏格兰的丹尼尔·麦考利(Daniel McAuley)向Libratus砸了277657美元,他补充说:“这是一场很有趣的竞争,但我们真的被打败了。”
董金(Dong Kim)在与Libratus的比赛中表现最为抢眼,在为期20天的比赛中,他只向AI投入了85649美元的芯片。
“即使在扑克界,这也是一个非常非常好的表现,”Kim谈到Libratus的游戏时说。
AI得到了一次重赛
这场名为“大脑vs人工智能:提高赌注”的比赛于1月11日至1月30日在匹兹堡的里弗斯赌场举行。18个月前,这里举办了首届“大脑vs人工智能”(Brains Vs. Artificial Intelligence)锦标赛,CMU的AI Claudico与董金(Dong Kim)、杰森•莱斯(Jason Les)以及职业选手比约恩•李(Bjorn Li)和道格•波尔克(Doug Polk)对决。在那场比赛中,克劳迪科和人类职业选手们共打出了8万手。灰尘散去后,波尔克、金和李的薯条比克洛迪克多,莱斯落后。
Claudico的开发者是CMU的计算机科学教授Tuomas Sandholm和他的博士生Noam Brown,他们认为那场比赛的结果在统计学上并不显著。克劳迪克在与职业球员的比赛中没有发挥足够的作用。
[相关:人工智能的未来会是什么样子?]
“那些人类取胜,作为一个群体,他们赢了,”桑德霍尔姆告诉CIO.com。“但我们不能对获得统计学显著的结果。即使打对那些绝对的,顶级球员,这是一个统计意义上并列。当然,AI是不是更好。”
桑德姆和布朗希望通过增加与Libratus的牌局数,得到统计上显著的结果。布朗说,这需要每手赢77百万分之一的大盲板。Libratus远远不止这些。经过计算,布朗说,Libratus以每只手147百万分之一的优势获胜。
桑德霍尔姆说:“最优秀的人工智能在不完善的信息下进行战略推理的能力已经超过了最优秀的人类。”
AI在游戏中有自己的头
在过去的几十年里,人工智能已经在各种各样的游戏中挑战了人类。1997年,IBM国际象棋计算机“深蓝”击败了国际象棋世界冠军加里·卡斯帕罗夫。2011年,IBM沃森击败了肯·詹宁斯(Ken Jennings)和布拉德·鲁特纳(Brad Ruttner),这两位在《危险边缘》(Jeopardy)游戏节目中获胜最多的选手。2015年,谷歌DeepMind的AlphaGo击败了被认为是世界上最好的棋手之一的韩国专业棋手李世石。
但值得注意的是,德州的无限制hold'em被广泛认为是遥远的边疆。与其他游戏不同,这是一种信息不完全的游戏——玩家只知道其中的一部分牌,他们可以虚张声势或使用其他策略来误导对手。它的复杂性是巨大的。游戏有10个特色160(数字1后跟160个零)信息集。每一组都以轮到该回合的玩家所感知的手中的游戏路径为特征。游戏的10160信息集比宇宙中原子的数量代表更多的信息集。
[相关:分析50:大数据创新者如何收获成果]
为了下棋,人工智能必须在不了解所有牌的情况下做出决定,同时试图嗅出对手的虚张声势。
为什么Libratus的胜利很重要
CMU计算机科学学院计算机科学系主任弗兰克·普芬宁在周二的一份声明中表示,Libratus的胜利是人工智能领域的一个新的里程碑,它对任何信息不完整、反对者散布错误信息的领域都具有意义。这些领域从商业谈判到军事战略、网络安全和医疗。
Pfenning说:“如果电脑不虚张声势,它就赢不了扑克。”“开发一种能够成功做到这一点的人工智能是科学上的一大步,而且有许多应用。想象一下,有一天你的智能手机能够为你为一辆新车讨价还价。这仅仅是个开始。”
然而,Libratus的计算能力远远超过了你的手机。它使用匹兹堡超级计算中心的桥梁计算机计算会前和期间的战略。在整个竞赛中,Libratus使用了桥的846个计算节点中的600个。“桥”的总速度为每秒1.35千兆次浮点运算,大约是高端笔记本电脑速度的7250倍。它的内存为274兆兆字节,相当于笔记本电脑的17500兆兆字节。
在整个比赛中,Libratus利用了大约1900万核心小时的计算和2600 TB信息的知识库,Nick Nystrom说,他是匹兹堡超级计算中心(PSC)国家科学基金会资助的桥梁系统的高级研究主任和首席研究员。总的来说,Libratus使用了大约46%的桥梁的计算能力。
“我们设计的桥梁将高性能计算和人工智能融合在一起,”尼斯特罗姆说。Libratus的成功是开发人工智能来解决复杂的现实世界问题的一个重要里程碑。与此同时,桥梁为物理科学、生物学、社会科学、商业甚至人文学科的新发现提供了动力。它独特地强调可用性,所以新项目总是受欢迎的。”
Libratus算法利用了Bridges的计算能力,逐渐发现了自身的弱点,并进行了改进。
Sandholm解释说:“每天比赛结束后,一个元算法会分析职业球员在Libratus策略中发现和利用的漏洞。”然后,它会根据漏洞的优先次序排列,并每天晚上使用超级计算机用算法修补前三名的漏洞。这与过去扑克中学习的用法非常不同。通常,研究人员会开发出利用对手弱点的算法。相反,这里的日常改进是关于算法修复我们自己策略中的漏洞。”
现在比赛已经结束,桑德霍尔姆说他计划分享所有的AIs秘密。他计划于2月4日至9日在旧金山举行的人工智能促进协会会议上开始演讲。他还计划提交给同行评议的科学会议和期刊。
他还指出,他将继续研究解决不完全信息博弈的核心技术,并将这些技术应用于现实世界的问题。这包括他与优化市场公司(Optimized Markets)的合作,该公司是他创立的,旨在实现谈判自动化。
这个故事,“在主要的人工智能赢,Libratus打败了四个顶级扑克专业人士”最初是由首席信息官 。