学习指导书
【内容简介】
《DDPG算法实现双积分系统控制与MATLAB程序视频》共2章13节视频,总学时87分钟,合1.4小时。它是《深度强化学习(DRL)及其应用与MATLAB程序详解视频》(合29.7小时)的第12章。本课程是利用DDPG算法对论文常用模型——双积分系统控制的应用实例,涉及程序详解及论文用图与误差分析等问题,这是一个完整的论文毕设写作和科研实例。
主要内容包括:视频课程内容介绍及慎拍不拍建议与辅导答疑说明,双积分系统简介,对程序解读、分析、加注和详解,对程序用的重要命令给出详解,详细讲解了8点可改之处及其可改建议,针对双积分系统讲解了模型扩展的方向,针对DDPG算法提出了算法扩展的思路,重点讲解了5个思考问题,用MATLAB自带的DDPG算法程序再解双积分系统控制策略问题,提供了训练阶段的回报与平均回报图像,提供了仿真测试DDPG智能体控制回合的状态、动作和奖励的图像,满足论文写作和科研所需的数据与图像。整个过程形成了一个“科学研究实际问题”的典型案例。
全部免费提供MATLAB程序,免费提供PPT课件,免费提供辅导答疑。
【如何为己所用】
(1)对自己问题选定出状态、连续动作和奖励函数。
(2)只需将自己问题的状态、连续动作和奖励函数替换所提供程序的关键字DoubleIntegrator-Continuous或自己创建环境即可,完整得到论文写作所需的数据、论文用图。
(3)该例程可以推广到求解其他的【连续动作】的强化学习问题。
【前期基础】衔接课程
(1)《强化学习的基本概念与理论》
(2)《DDPG算法及其步骤与优缺点分析》
【后期选学】相关课程推荐
(1)《PG算法自带函数程序详解双积分系统控制问题》
(2)《连续动作问题用DDPG算法自编工具箱函数程序实现控制》
【强化学习类算法视频课程】推荐
(1)《强化学习(RL)及其应用与MATLAB程序详解视频》
(2)《深度强化学习(DRL)及其应用与MATLAB程序详解视频》
(3)《强化学习设计器使用与MATLAB程序详解视频》
(4)《如何创建强化学习问题的MATLAB环境及程序详解视频》
(5)《如何创建强化学习问题的Simulink环境及程序详解视频》
(6)《DQN算法实现车杆平衡控制与MATLAB程序详解视频》
(7)《PG算法实现双积分系统控制与MATLAB程序详解视频》
(8)《AC算法实现车杆平衡控制与MATLAB程序详解视频》
(9)《DDPG算法实现双积分系统控制与MATLAB程序详解视频》
一、学习指导方案
1、全部视频都在网上。请首先按照视频文件序号由小到大(若前序号相同,说明视频内容密切联系,再看后面序号大小)的序号观看,保证内容由浅入深地顺序学习。
2、在看视频的同时,利用【倍速】【暂停】【倒回】操作,最好运行程序文件。
3、将存在的问题记录下来,看看视频是否讲解。对视频还是没有讲解的问题,尽快问【面对面数学】答疑。
4、视频观看结束后,看看PPT课件,复习、巩固学习效果。
5、视频清晰度:(1)建议屏幕分辨率设置为1920x1080 或者屏幕分辨率1280x720。(2)全屏播放。这样看视频更加清晰。
6、倍速播放:现在【淘宝新平台】已经具备【倍速播放】视频功能。