颤抖吧人类!阿尔法狗之后又有了冷扑大师
恐怕大家都是从阿尔法狗击败李世乭这条热文,才开始关注AI的吧,然而现在不光有了阿尔法狗,还出了一个冷扑大师,专攻德扑的一款AI机器人。
首先先来了解下德州扑克与棋类的区别。围棋是一种“完美信息游戏”,场面上所有的情况都黑白分明地摆在棋面上,双方掌握对等的信息。然而,德扑中隐藏了很多信息,是一种“非完美信息游戏”。玩家不知道对手手中是什么牌,不知道五张公共牌会开出怎样的结果,也不知道对手猜测自己握有怎样的手牌。因此,虽然一盘德扑的决策点数量是10的160次方,要少于围棋,但光靠搜索是打不了德扑的。德扑由此跳出了在搜索量上的较量,对AI提出了另一个方向上的考验:应对隐藏的信息。
阿尔法狗的几个基本原理,分别为:走棋网络(Policy Network),给定当前局面,预测和采样下一步的走棋;快速走子(Fast rollout),在适当牺牲走棋质量的条件下提高速度;价值网络(Value Network),给定当前局面,估计双方胜率;蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上三个部分串联成一个完整的系统。
冷扑大师的算法则主要基于:纳什均衡、虚拟遗憾最小化算法(Counterfactual Regret Minimization,CFR)、残局解算器(end-game solver)和自我强化学习等模块。
然而对于用户来说,阿尔法狗和冷扑大师除了能让我们看看新闻以外,哪个又更有用呢?
在现实生活中,我们遇到的事情会更像玩德扑:商业谈判时对方未知的底牌、房屋拍卖时竞争对手难测的举动、股票交易中一些隐藏的内部消息。桑德霍姆认为,德扑AI打开了靠人工智能解决随机事件和隐藏信息的大门。这样的AI,才有望离开虚拟的棋牌世界,成为人类在现实生活中谈判、博弈和投资的好帮手。
相关文章
- 说说 C# 9 新特性的实际运用
- 【ASP.NET Core】EF Core - “导航属性”
- 【ASP.NET Core】JSON Patch 使用简述
- 【ASP.NET Core】MVC中自定义视图的查找位置
- 【Asp.net Core】在 Linux 子系统中安装 nginx 并配置反向代理
- 【ASP.NET Core】在Win 10 的 Linux 子系统中安装 .NET Core
- 【Win 10 应用开发】MIDI 音乐合成——更改乐器音色
- 【Win 10 应用开发】MIDI 音乐合成——音符消息篇
- 【Win 10 应用开发】MIDI 音乐合成——乐理篇
- 【Win 10 应用开发】将墨迹保存到图像的两种方法
- 【Win 10 应用开发】UI Composition 札记(八):用 XamlLight 制作灯光效果
- 【Win 10 应用开发】UI Composition 札记(七):基于表达式的动画
- 【Win 10 应用开发】UI Composition 札记(六):动画
- 【Win 10 应用开发】UI Composition 札记(五):灯光
- 【Win 10 应用开发】UI Composition 札记(四):绘制图形
- 【Win 10 应用开发】UI Composition 札记(三):与 XAML 集成
- 【Win 10 应用开发】UI Composition 札记(二):基本构件
- 【Win 10 应用开发】在代码中加载文本资源
- 怎么更改spyder编程界面背景颜色
- 【Windows 10 应用开发】使用x:Bind标记动态获得计算结果