您好,欢迎进入乐鱼体育永久网址【363050.com】
乐鱼体育-LEYU乐鱼体育官方网站-LEYU SPORTS

联系我们

邮箱:363050.com
电话:@BETHASH6
地址:乐鱼体育永久网址【363050.com】 在线咨询

乐鱼体育-LEYU乐鱼体育官方网站-LEYU SPORTS国内唯一能打德州扑克的网址曝光中科院诚意出品AI在线发牌

发布日期:2025-06-07 20:00 浏览次数:

  乐鱼体育官方网站LEYU SPORTS[永久网址:363050.com]是一家线上综合娱乐集团,全球最大线上体育娱乐服务商。乐鱼拥有乐鱼体育,LEYU乐鱼体育官方网站,乐鱼体育靠谱吗,乐鱼体育app,乐鱼体育官网,“欧洲马耳他mga”颁发的合法执照,是受国际认可的合法公司。欢迎注册!最近,在美国人工智能协会举办的人工智能国际顶会——AAAI 2022上,大会卓越论文奖,颁给了一个轻量型德州扑克AI程序——AlphaHoldem。在和高水平德州扑克选手的对抗中,它的决策速度和各方面表现,已经达到人类专业玩家的水平。

  没错,这一次获奖的德州扑克AI——AlphaHoldem,就是类似AlphaGo的所在。只不过,在针对AlphaHoldem的训练过程中,它的训练模型是德州扑克。

  和围棋相比,德州扑克更能考验AI在信息不完备、对手不确定情况下的智能博弈技术。所以近几年来,业内公认德州扑克非常适合作为一个虚拟实验环境,对博弈的相关基础理论方法、核心技术算法,进行深入研究。

  目前,比较主流的德州扑克AI核心思想,是利用一种“反事实遗憾最小化(CFR)”算法,逼近纳什均衡策略——即任意一位参与者,在其他所有参与者策略确定的情况下,他所做的策略都是“最优解”。

  不过,这种方法一直有一个比较明显的缺陷:它太过依赖人类专家去进行博弈树抽象。这就意味着,无论是在进行AI训练还是最后对局,它都需要大量的计算和存储资源。而这,也成为限制德州扑克AI进一步发展的阻碍。

  兴军亮团队之所以能在AAAI 2022上获得卓越论文奖,就是因为他们为AlphaHoldem采用了一种新的、基于端到端的深度强化学习算法。

  数据显示,AlphaHoldem每次决策的速度甚至都不到3毫秒,比之前同类AI决策速度快了1000倍。并且,AlphaHoldem与4位高水平德州扑克选手对抗1万局的结果也证明,它已经达到了人类专业玩家水平。

  兴军亮之所以有了用游戏训练AI的想法,最早还是受到了AlphaGo的启发。透过教AI下围棋,兴军亮发现,这个动作的实质其实是在解决AI领域的“认知智能”问题,让AI不但知道“是什么”,还能知道“为什么”。

  再加上人工智能的发展历史上,游戏本身就是相关研究的试验场。用游戏训练出更厉害的AI,就成了兴军亮的目标。

  在这个过程中,兴军亮越发觉得,玩游戏是一件非常有意思的事。尤其是不同游戏的机制设置,非常适合用来研究一些基础的科学问题。这其中,就有游戏博弈。

  就拿此次获奖的德州扑克AI程序来说,其本质就是一个不完美信息的博弈问题。因为按照德州扑克的游戏规则,每个人手上都有两张私有牌。牌面的大小并不影响最终的胜负,因为玩家完全可以通过假装牌面大、押注金额大等手段吓跑对手。

  随后,他们又进一步提升了游戏学习的性能。这次,他们仅用1台服务器,训练不到3天,就能达到预期水平。

  而在这个过程中,参与训练的AI能学会一些类似于人类专业选手才会掌握的计谋。而这,正是不完美信息博弈最有趣的地方。目前,兴军亮和团队打造的德州扑克在线人机对抗平台OpenHoldem(),目前已经对外开放。据兴军亮说,这个系统可能是国内唯一能公开打德州扑克的地方。

  像不完美信息博弈,这种机制,在经济政策的制定、法律法规的优化、外交策略的选择等领域,都有很广泛的应用。这些,是国际同行正在努力攻克的,也是国内相关研究比较薄弱的。

  去训练出一个更聪明、更有用、可以和人类融为一体的人工智能,是兴军亮不懈追求的方向。

联系方式

全国服务热线

@BETHASH6

手 机:@BETHASH6

地 址:乐鱼体育永久网址【363050.com】

扫一扫,加微信

Copyright © 2002-2025 乐鱼体育官方网站 版权所有 非商用版本 备案号: