强化学习是近几十年来迅速发展起来的一类机器学习算法,并且从1980年以来逐渐成为机器学习研究的一个比较活跃领域,引起了包括计算机科学、控制科学以及心理学领域的学者的极大关注。 所有的类型机器人或机制设计自控器对于科学家和工程师是具有很大的挑战性, 由早期的计算机时代至今。通过机械控制可以模拟简单动物的行为,如步行或游泳, 在人工的机械装置中模拟或仿真在向外延伸上是非常困难的。这个论题是介绍人工神经网络和增强激发学习的一些技术帮助如何解决这样问题的研究。在许多领域的重要应用中找到控制动力系统的最佳的行动是至关重要的,例如,机器人技术,工业的加工和处理,或太空船中飞。通过对一些问题的研究使得一些主要的研究成果被应用到更高阶的理论问题中, 并且提供实际的方法建立有效率的控制器。 最后,对于外部环境动力学信息已知的强化学习问题,动态规划是解决它的好方法,经过分析发现,Dijkstra回溯是算法快速收敛的关键。本文对动态规划算法进行了深入地研究,并在动态规划算法的基础上进行了改进。 |
计算机机器学习
- 上一篇:论我国电子商务发展趋势
- 下一篇:基于B/S模式的通用考试系统
查看评论
已有0位网友发表了看法