| 强化学习理论,算法及应用 |
| 张汝波 顾国昌 |
| 关键词:强化学习 学习理论 学习算法 机器学习 智能控制 |
| 主要内容:强化学习(reinforcement learning)一词来自于行为心理学,这一理论把行为学习看成是反复试验的过程,从而把环境状态映射成相应的动作。首先全面地介绍了强化学习理论的主要算法,即瞬时差分法、Q-学习算法及自适应启发评价算法;然后介绍了强化学习的应用情况;最后讨论了强化学习目前所要研究的问题。 |
| 《控制理论与应用》 2000,17(5).-637-642 |
| 全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp |