针对倒立摆系统,提出了在结构上可生长的神经网络控制方案。网络利用细胞生长结构算法,在工作域中实现对状态变量的模式分类,并通过新神经元的插入实现网络规模的生长演化。在输出域中针对倒立摆控制任务采用强化Hebb 学习机制,实现不同的神经元以最佳方式响应不同性质的信号刺激。仿真表明,通过神经网络自身的发育,该方案有效控制了倒立摆系统。神经网络具有分布信息存储、自适应和自学习功能强等优点,被广泛应用于非线性控制领域,倒立摆系统是智能控制中的一个典型问题,它是一个自然不稳定体,倒立摆的神经网络控制研究取得了很大进展。1998 年,蒋国飞等[1]通过训练BP 网络来逼近Q 值函数,并利用BP 网络的泛化能力,实现了基于Q 学习算法的状态未离散化的确定和随机倒立摆的无模型学习控制。2000 年,Si 等[2]将神经网络理论与增强学习相结合,提出了一种在线学习系统,通过自身偏差不断学习,系统状态被学习过程所储存。但是现有的控制方案中所采用的多为事先规定结构和规模神经网络,其本身在处理映射问题上就会存在很多局限。B. Fritzke (1994) 提出一种细胞生长结构 (Growing Cell Structure)[3],以自组织特征映射算法为基础,但比它优越在可以自动找到合适的网络规模,这种结构是通过节点增长的方式来实现的.本文结合细胞生长结构的这一显著优势,针对倒立摆这样的典型控制问题,提出了在结构上可生长的神经网络控制方案。网络利用细胞生长结构算法,在工作域中实现对状态变量的模式分类,并通过新神经元的插入实现网络规模的生长演化。在输出域中针对倒立摆控制任务采用强化Hebb学习机制,实现不同的神经元以最佳方式响应不同性质的信号刺激。仿真表明,通过神经网络自身的发育,该方案有效控制了倒立摆系统。