您当前的位置:首页 > 文章摘抄 > 正文

ai棋牌应用的现实意义是什么(AI棋牌应用的现实意义)

ai棋牌应用的现实意义是什么(AI棋牌应用的现实意义)

人工智能在棋牌游戏中的应用将推动游戏决策的研究。基于AI在棋牌中的应用而开发的相关AI游戏工具,在经济金融领域的风险预测、军事领域的战局预测等领域具有广阔的应用前景。

半个多世纪以来,棋牌游戏一直是人工智能(AI)发展和创新的舞台。在被视为智力游戏的棋牌中用AI打败人类,一直是AI研究所追求的目标。从1997年IBM 美国超级计算机“深蓝”击败了国际象棋世界冠军卡斯帕罗夫,到2016年谷歌人工智能机器人AlphaGo击败了世界象棋冠军李世石,人工智能在象棋比赛中取得了许多突破。2019年7月,人工智能机器人Pluribus 由卡耐基梅隆大学和脸书公司联合开发,在无限制德州扑克中击败了五名人类专家玩家em 6人对决,AI拿下德州Hold上的另一个城市em战场。

Pluribus概述

Pluribus s与人类的比赛分为两种模式:1 AI与5名人类选手,5 AI与1名人类选手。Pluribus在这两种模式中都取得了胜利。为了打败人类,Pluribus在策略、算法、能耗等方面做了很多优化。

Pluribus开发的核心策略是使用改进的蒙特卡罗反事实后悔最小化(MCCFR)通过自我博弈进行学习。Pluribus首先随机选择博弈方式,通过蛮力计算获得收敛结果,并将概率分布拟合到这些动作上,使其实力在不断的自我博弈中逐渐变强。在整个学习过程中,AI机器人与自己对弈,不使用任何人类的游戏数据作为输入。

在算法上,为了解决6名球员的额外复杂性,Pluribus集成了一种新的在线搜索算法,使AI能够提前预测并决定游戏中的下一步行动。这种机制被称为搜索功能。以前棋牌算法的每一个决策都需要计算到游戏结束,而在线搜索算法只需要搜索前几步。此外,Pluribus还利用了一种新的更快的自玩不完美信息游戏算法。基于以上两种算法,可以用很少的处理能力和内存训练Pluribus。

在能耗方面,研究人员使用了内存不超过512GB的64核服务器来完成Pluribus 8天的自游戏训练,花费150美元左右,相对于其他自游戏AI学习来说是极低的。而且算法的改进使得研究人员可以用更少的资源消耗实现很大的性能提升。

扑克人工智能与其他国际象棋人工智能的比较

扑克AI和象棋AI的基本原理是一样的,都是采用蒙特卡罗搜索树算法作为基本算法,在不断迭代的过程中不依赖人类提供的策略实现自我学习。不同的是棋盘上展示的是棋子,结果是有限的,所有的结果都是可以计算的。这种情况叫做完美信息博弈在纸牌游戏中,不可能知道对手卡,其中包含隐藏的信息,结果可能是多样的,这导致计算难度和金额大大增加,被称为不完全信息博弈。

象棋人工智能

象棋游戏包括双陆棋、国际象棋、围棋等。游戏中的所有信息和决策都是公开的,玩家只有两种可能的结果,赢或输。从某种意义上说,这让训练AI变得更加容易。国际象棋理论上可以通过计算机模拟每一种可能的情况,从而进行一场信息完美的动态博弈。在这种完美信息博弈中,AI机器人往往采用实时搜索。例如,当模型正在决定下一步如何走时,象棋AI通常会考虑一些未来的移动步骤,直到算法的远见达到了深度的上限。但是,围棋的棋盘比哈勃体积中的原子总数更容易发生变化。所以围棋AI主要是通过深度学习技术训练用来判断胜负结果概率的价值网络来增强AI 的发挥能力。

麻将

麻将的策略需要增加赢分的预期,最大限度的发挥大牌的可能性,同时尽量避开对手这是大牌。这种出牌策略显然有最优解。为了有更大的可能性和大牌,AI需要通过手牌和弃牌池中的牌,计算出推进手牌(摸到有效牌)和打圈牌(吃、摸、打)的概率,进而计算出该牌得分的期望值。目前最强的麻将AI机器人是殴打由日本东京大学开发。

AI扑克

以德州扑克为例。em为例。在游戏中,玩家可以不能获得关于所发生事情的所有信息(如对手卡片等。),所以这个游戏属于不完全信息游戏。德州扑克em一直是人工智能领域最难的重大问题之一,因为与桌游不同,扑克AI必须推理隐藏的信息,并仔细平衡自己的策略。同时,与桌游相比,扑克游戏中需要更多的诈唬等游戏策略。

在Pluribus之前,AI机器人已经在两个玩家之间的完美信息零和博弈中取得了许多显著的成功,但现实世界中的大多数战略互动都涉及隐藏信息,它不是两个玩家之间的零和博弈。Pluribus的成功表明,基于自博弈和搜索算法的AI可以在复杂的多人场景中取得良好的效果。

人工智能象棋应用的现实意义

Pluribus提出了一种方法,有效地解决了博弈论在大状态空间和隐藏信息下的推理挑战。开发的技术很大程度上独立于扑克领域,可以用于大量的不完美信息游戏。Pluribus处理的许多问题对应于现实世界中的常见问题,例如不了解你的对手卡对应现实中的不完全信息,下注策略和由此产生的结果对应现实中的风险管理,确认你的对手的模式并利用它们对应于现实中的代理建模,并且唬人对应现实生活中的威胁。

其实棋牌游戏的本质是竞争和对抗,它的目标(评价标准)是由游戏规则来定义的。玩家使用各种策略来实现目标,这涉及到相当数量的游戏过程。人工智能在棋牌游戏中的应用将推动游戏决策的研究。基于象棋AI应用的相关AI游戏工具在经济金融领域的风险预测、军事领域的战局预测等领域有着广泛的应用前景。

在经济金融领域,无论是对经济发展总体趋势的预测,还是对银行、保险、股票市场等子行业风险模型的建立,都需要依赖大量不完全信息做决定。AI游戏工具可以通过处理不完美信息来获得最佳决策。政府可以利用AI游戏工具预测社会行业的未来趋势,判断供求关系,引导行业合理有序健康发展。银行和保险公司可以使用人工智能工具判断短期行业趋势,并有效评估企业风险,以决定是否达成交易。

在军事领域,具有自学习功能的人工智能游戏工具与军棋推演相结合,将产生强大的战斗力,帮助军队获得先机。自20世纪70年代初以来,美国陆军建立了一个地面作战模拟系统根据全自动兵棋。90年代初,海湾战争爆发前,美军用兵棋推演整场战争,战争的进程与美军事前几乎一模一样。随着技术的进步,算法不断成熟,进一步降低了对计算能力的需求。与此同时,计算技术正朝着系统小型化和高速处理的方向发展。具有超强自主学习和计算能力的AI系统与作战模拟系统相结合,将提高对战局的预测和控制。未来,AI系统将有望与战场指挥系统直接相连,其快速推断战局、高效制定作战计划的能力将主导战争的胜负。

标签:AI游戏信息


声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,谢谢。

上一篇: 双线竹芋叶子焦边干枯是怎么回事(双线竹芋)

下一篇: jugate手机zj007(jugate手机)



推荐阅读