第七章 人工智能博弈
2023-04-18 14:24:01 时间
博弈行为:带有互相竞争性质的主体,为了达到各自目标和利益,采取的带有对抗性质的行为。
参与者:参与博弈的决策主体。
策略:参与者可以采取的行动方案,是一整套在爱去行动之前就已经准备好的完整方案。
- 某个参与者可采纳策略的全体集合形成策略集;
- 所有参与者各自采取行动后形成的状态被称为局势;
- 如果参与者可以通过一定概率分布来选择若干个不同的策略,这样的策略称为混合策略。弱参与者每次行动都选择某个确定的策略,这样的策略称为纯策略;
收益:各个参与者在不同局势下得到的利益(混合策略下的收益为期望收益)
规则:对参与者行动的先后排序、参与者获得信息多少等内容的规定。
博弈的分类
合作博弈:部分参与者可以组成联盟以获得更大收益。
非合作博弈:参与者在决策中都彼此独立,不是先达成合作意向。
静态博弈:所有参与者同时决策,或参与者互相不知道对方的决策。
动态博弈:参与者所采取行为的先后顺序由规则决定,且后行动者知道先行动者所采取的行为。
完全信息博弈:所有参与者均了解其他参与者的策略集、收益等信息。
不完全信息博弈:并非所有参与者均掌握了所有信息。
nash定理:若参与者有限,每位参与者的策略集有限,收益函数为实值函数,则博弈比存在混合策略意义下的nash均衡。
遗憾最小化算法
策略选择:
虚拟遗憾最小化算法
相关文章
- 树莓派自建互联网云盘,跨设备打通全平台
- 跨混合IT进行有效实时监测的6个步骤
- 关于Spring注解容器配置的那些事,掌握这几点,不再难!
- Gartner公布影响基础设施和运营的六大趋势,涉及分布式云等
- matplotlib scatter画图报错:TypeError: ufunc ‘sqrt‘ not supported for the input types...rule ‘‘safe‘‘
- 《手把手教你》系列技巧篇(三十六)java+selenium自动化-单、多选按钮操作-番外篇
- 什么,你还在用拼音命名法?
- 为什么远程工作需要移动统一通信
- 异常检测:季节性ESD Python pip安装sesd库报错解决
- Kerlink和Radio Bridge为私有IoT网络提供LoRaWAN解决方案
- 超简单的树莓派SD卡扩容方案
- 在COVID-19中,我们是否忽视了边境安全?
- 大数据开发为什么要参加系统学习呢?
- 为什么加了@WebFilter注解,Spring却没有给我自动注入该过滤器?
- 《树莓派4B家庭服务器搭建指南》第五期
- WLAN系统实施过程中的无线网络信号优化方法
- 当PaaS与DevOps共行
- 运营商们能不能站着把钱挣了?
- 《树莓派4B家庭服务器搭建指南》第六期
- IPv6在互联网络中的运行方式