Q学习角色值法在机器人足球比赛中的应用-电子电路相关资料下载-EEWORLD下载中心

Q学习角色值法在机器人足球比赛中的应用pdf

1星发布者: justyouandmehr

2013-09-22 | 1积分 | 286.17KB | 1 次下载

文档简介

提出了基于Q学习的角色值方法，避免了在比赛中由于机器人之间的频繁角色转换而造成的系统效率损失及系统不稳定。该方法完善了多智能体系统的整体调整方法，有效地解决了在实际系统设计和实现过程中遇到的问题。经FIRA仿真比赛检验，该方法是有效的，降低了机器人丢球、漏球、不作为的可能性，弥补了按区域分配固定角色的不足，有较好的实用性。关键词多智能体系统; 强化学习; 机器人; 角色值Multi-Agent System(MAS)是由自主的Agent通过协作完成某些任务或达到某些目标的计算系统，它通过竞争或磋商等手段协调解决各Agent成员目标和行为之间的矛盾和冲突[1]。足球机器人是一个典型的多Agent系统，各个机器人之间协作的好坏是决定比赛胜负的关键之一。在机器人足球比赛过程中，由于两队的激烈争夺，球和双方队员的位置在不断变化。如果对球队中的每个队员安排固定的角色和固定的攻防区域，比赛中常会出现队员“不作为”的现象[2]。如某个队员在自己区域带球，一旦跨出指定区域，它不会“越权”，结果是丢下球不管；另一方面，即使球在它的附近，但还未进入它的区域，该队员也不会去抢球，往往会错失良机。此外，对于5VS5、11VSl1类型的比赛，由于是多个队员排兵布阵，除了要考虑对对方队员的避碰外，还必须考虑本队队员之间的避障；而且各个机器人的“体力”消耗不同(如RoboCup)中有体力模型，实物机器人存在电量消耗)，不宜让某个机器人始终担当一个固定不变的角色。

加载更多

推荐下载

                        HSPICE的基本使用方法

                        新编单片机原理与应用实验课件_潘永雄

                        扬声器磁路的计算机仿真计算

                        基于MSC.NASTRAN的汽车车架结构的仿真研究

                        基于PROTEUS的ARM虚拟开发技术 -- 附带光盘

                        USC直流炉水冷壁壁温监测有限元分析

                        冷轧机液压AGC系统GPC控制仿真研究

                        电路实验教案

                        基于多模型的动态矩阵控制Dynamic Matrix Control based on Multiple Models

                        viper设计软件

                        路由选择的一种新遗传算法

                        用proteus与keil整合构建单片机虚拟仿真平台

                        虚拟环境中软体的包围盒更新方法分析

                        CH375模块仿真

                        故障树模块化分析系统可靠性

                        8阶3电容椭圆函数低通滤波器1000hzMultisim电路

                        基于RS-FSE的仿真可信度评估方法

                        自适应比特分配算法在高速遥测系统中的应用

                        一种基于网络密度分簇的移动信标辅助定位方法

                        紫外光通信大气信道模型研究

                        Proteus_Pro_7.7安装说明

                        交通分析仿真软件的研究

                        HLA OM在装备保障仿真中的应用研究

                        HFSS_v10.0_基础培训教程二.pdf )

                        微流控生物芯片的磁场仿真及实验对比

                        IGBT双脉冲测试方法

                        基于System_View的比特误码率测试的仿真

                        采用以太网硬件在环路实现高带宽DSP仿真设计

                        TD-SCDMA网络测试仪NBAP协议仿真软件设计

                        罗兰C周期识别时频分析方法研究

精选文集