产业集群信息网

产业集群决策

1 生物技术资源文献
2 电子信息资源文献
3 环境科学文献资源
4 海洋科学技术文献
5 新材料数据库文献
6 光机电技术资源文献

强化学习理论,算法及应用

张汝波顾国昌

关键词：强化学习学习理论学习算法机器学习智能控制

主要内容：强化学习（ｒｅｉｎｆｏｒｃｅｍｅｎｔｌｅａｒｎｉｎｇ）一词来自于行为心理学，这一理论把行为学习看成是反复试验的过程，从而把环境状态映射成相应的动作。首先全面地介绍了强化学习理论的主要算法，即瞬时差分法、Ｑ－学习算法及自适应启发评价算法；然后介绍了强化学习的应用情况；最后讨论了强化学习目前所要研究的问题。

《控制理论与应用》 2000,17(5).-637-642

全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp