| 一种改进的自动分层算法BMAXQ |
| 胡坤 余雪丽 李志 |
| 关键词:分层强化学习 MAXQ算法 BP神经网络 子任务 |
| 主要内容:针对MAXQ算法存在的弊端,提出一种改进的分层学习算法BMAXQ。该方法修改了MAXQ的抽象机制,利用BP神经网络的特点,使得Agent能够自动发现子任务,实现各分层的并行学习,适应动态环境下的学习任务。 |
| 《计算机工程与应用》 2011,47(30).-1-3 |
| 全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp |