论文精选 | AI学习也要先定个小目标,让人工智能具有社会意识——《具有社会意识的多智能体学习:面向社会最优解》
应用场景导读:多智能体系统,例如移动传感器、无人运载器等,作为分布式人工智能研究的一个重要分支,由于其具有较强的容错性、鲁棒性和可扩展性等优点,被广泛地应用于军事、工农业生产、医学、交通、服务等各个领域。多智能体系统是由多个具有计算和移动能力的智能体所组成的集合,其中每个智能体是一个物理的或抽象的实体,能作用于自身和环境,并与其它智能体通讯。
标题:
具有社会意识的多智能体学习:面向社会最优解
摘要:
在多智能体系统中,学习能力对每个智能体来说至关重要,这关乎其在动态环境中面对未知对手时如何正常反应。从系统设计者的角度说,非常希望智能体能学会面向社会最优解的协作,同时避免被自私的对手利用。为此,我们提出一种新颖的梯度提升算法(SA-IGA),通过将社会意识纳入策略更新过程来加强基本的梯度提升算法。我们从理论上分析了基于动态系统理论的SA-IGA的学习动态,并且SA-IGA在包括对称游戏的众多游戏中都有线性动态。对两个代表游戏(“囚徒困境”游戏和协调游戏)的学习动态进行了详细分析。在SA-IGA概念的基础上,我们进一步提出一个基于Q学习更新规则的多智能体学习算法,称为SA-PGA。仿真结果表明,SA-PGA智能体相比以前面向有条件联合行动学习者(CJAL)的社会最优准则,可以获得更高的社会福利,并通过纳什均衡解决方案对独立理性对手具有可抗性。
第一作者简介:
李晓红,女,1965年9月出生,工学博士学位,天津大学计算机及信息技术系、教授,博士生导师。计算机学会高级会员,ACM会员、软件工程专委会委员;全国高等学校计算机教育研究会 常务理事;天津大学女工委员,学院工会副主席。近年来致力于安全软件工程、可信软件及信息安全领域的研究工作。
计算机学会高级会员,ACM会员、软件工程专委会委员;全国高等学校计算机教育研究会 常务理事;国家科技奖励评审专家;教育部学位与研究生教育发展中心学位论文评审、学科建设和评估咨询专家 ;《计算机学报》、《计算机科学》等杂志审稿专家;软件工程、信息安全相关领域国际期刊、国际会议审稿专家;计算机学院学位委员会委员、学术委员会委员、学科建设委员会成员、教学指导委员会委员兼秘书;学院985专家组成员兼秘书;天津大学女工委员,学院工会副主席。
近年来主持或参与完成国家级、省部级以及横向科研课题近20项,近年来已发表学术论文50余篇,其中学位与研究生教育重要期刊20多篇,国际会议20多篇,被EI检索20多篇, SCI检索6篇。申报国家发明专利20余项,已授权6项。软件著作权4项。专著1部,获省部级科技奖1项。现作为项目负责人主持国家基金重点项目1项(子课题负责人)、国家基金面上项目1项,天津市基础重点项目1项、企业合作项目1项。
via PRICAI 2016
论文原文件下载
雷锋网(公众号:雷锋网)按: 本文由雷锋网独家编译,未经许可禁止转载!
雷锋网原创文章,未经授权禁止转载。详情见转载须知。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/60802.html
aliyuniPhonePhone人工智能安全游戏相关文章
- 还只会卷论文吗?70页报告解密顶级大厂如何玩转AI技术(附完整下载链接)
- 一小时复现AAAI 2022论文,是怎么做到的……
- [AI安全论文] 20.RAID19 基于Android移动设备的互联网流量中的位置数据泄漏分析(译文)
- SCI论文投稿Cover Letter的写作
- SPPnet论文总结
- 8月AI论文GitHub十强榜出炉!语言-图像模型连斩Top2
- DeepMind、牛津研究员合著论文预测:AI很有可能终结人类!
- [论文] 一类Poisson-Nernst-Planck方程的边平均有限元计算
- [AI安全论文] 24.从Word2vec和Doc2vec到Deepwalk和G2V,再到Asm2vec和Log2vec(上)
- Nature封面论文撤稿闹大了,认定首个室温超导体数据存疑!领域大佬尝试复现6次全失败,9位作者集体抗议无效
- 计量经济学课程论文 – 学金融的文史哲小生
- Ai智慧社区_AI社区医院
- EMNLP2022 | “Meta AI 9篇接受论文”,其中7篇主会、2篇Findings
- ICLR 2022最佳论文解读
- [Nat.Mach.Intell.|论文简读]scBERT 用于单细胞RNA-seq数据的细胞类型标注的大规模预训练深度语言模型
- 15年磨一剑!张益唐111页「零点猜想」论文终于来了
- AI论文学习资料汇总
- 【工具】用AI辅助论文/博客的写作:Obsidian+Text Generator的详细安装教程
- 10 分钟,带你了解 3 篇 SIGMOD、WWW 等数据库顶会论文的研究成果 | Q推荐
- AIGC 席卷 AI 顶会:ICLR 2023 论文得分出炉,扩散模型研究暴增
- ICLR 2023 最高分论文被锤抄袭??
- ai下载正版下载AI-中文版Ai-下载Ai下载
- 前沿论文 | 谷歌OpenAI联合发布AI安全五大准则,取代机器人三定律预防科技暴走(下)
- 深入了解MySQL中AI的含义与用法(mysql中ai表示)
- 揭秘:“论文工厂”的造假论文有这8大特征
- 亚马逊悄然收购AI安全公司harvest.ai,增强云服务安全