一种改进的自动分层算法BMAXQ
 
胡坤 余雪丽 李志

关键词:分层强化学习 MAXQ算法 BP神经网络 子任务
 
主要内容:针对MAXQ算法存在的弊端,提出一种改进的分层学习算法BMAXQ。该方法修改了MAXQ的抽象机制,利用BP神经网络的特点,使得Agent能够自动发现子任务,实现各分层的并行学习,适应动态环境下的学习任务。
 
《计算机工程与应用》  2011,47(30).-1-3
全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp
仿站