《强化学习设计器(RLD)使用与MATLAB程序详解视频》共9章39节视频,总学时322-6分钟,合5.3小时。利用强化学习设计器,利用自己创建的MATLAB环境或Simulink环境,就可以利用多个深度强化学习算法来训练、模拟智能体。强化学习设计器是快速、全面学习深度强化学习的【工具箱】。
主要内容包括:视频课程内容介绍及慎拍不拍说明与参考文献,创建环境和创建智能体及超参数设置,训练智能体操作及训练参数设置,仿真测试智能体及测试参数设置,数据检查器操作及保存训练进程和仿真结果图像,车杆平衡系统控制问题利用Simulink环境和DQN智能体训练仿真,双积分系统控制问题利用MATLAB环境和PPO智能体训练仿真,四足机器人行走控制问题利用Simulink环境和DDPG智能体训练仿真,四足机器人行走控制问题利用Simulink环境和TD3智能体训练仿真。
全部免费提供MATLAB程序,免费提供辅导答疑,免费提供PPT课件。
【如何为己所用】:
(1)只需具有自己的强化学习问题的环境设置,代入所给的操作界面求解即可。
(2)利用提供的强化学习环境即可完整得到论文写作所需的用图。
【前期基础】课程或知识:
(1)《如何创建强化学习问题的MATLAB环境及程序详解视频》
(2)《如何创建强化学习问题的Simulink环境及程序详解视频》
(3)《深度强化学习DRL及其应用与MATLAB程序详解视频》
【后期选学】课程推荐:
(1)《强化学习RL及其应用与MATLAB程序详解视频》
(2)《深度强化学习DRL及其应用与MATLAB程序详解视频》
(3)《如何创建强化学习问题的MATLAB环境及程序详解视频》
(4)《如何创建强化学习问题的Simulink环境及程序详解视频》
(5)《AC算法实现股票交易操作深度强化学习与MATLAB程序》
【深度强化学习算法视频课程】推荐:
(1)《强化学习RL及其应用与MATLAB程序详解视频》
(2)《深度强化学习DRL及其应用与MATLAB程序详解视频》
(3)《强化学习设计器使用与MATLAB程序详解视频》
(4)《如何创建强化学习问题的MATLAB环境及程序详解视频》
(5)《如何创建强化学习问题的Simulink环境及程序详解视频》
(6)《AC算法实现股票交易操作深度强化学习与MATLAB程序》
(7)《DDPG算法实现双积分系统控制与MATLAB程序详解视频》
一、学习指导方案
1、全部视频都在网上。请首先按照视频文件序号由小到大(若前序号相同,说明视频内容密切联系,再看后面序号大小)的序号观看,保证内容由浅入深地顺序学习。
2、在看视频的同时,利用【倍速】【暂停】【倒回】操作,最好运行程序文件。
3、将存在的问题记录下来,看看视频是否讲解。对视频还是没有讲解的问题,尽快问【面对面数学】答疑。
4、视频观看结束后,看看PPT课件,复习、巩固学习效果。
5、视频清晰度:(1)建议屏幕分辨率设置为1920x1080 或者屏幕分辨率1280x720。(2)全屏播放。这样看视频更加清晰。
6、倍速播放:现在【淘宝新平台】已经具备【倍速播放】视频功能。
四、目 录
第一章 视频课程内容介绍及慎拍不拍说明与参考文献(25-6分钟)
0、先看全面讲解9个关键重点问题和店主预言先告必看第三版(38+4分钟)
1、RLD1_1视频讲些什么内容及能干什么说明(11-6分钟,网络上免费“试看”)
2、RLD1_2MATLAB程序免费提供及课程亮点特点说明(3分钟,网络上免费“试看”)
3、RLD1_3慎拍不拍建议与学习基础要求及参考文献(7分钟,网络上免费“试看”)
4、RLD1_4教学顾虑及教与学对策建议(4分钟,网络上免费“试看”)
第二章 创建环境和创建智能体及超参数设置(62分钟)
5、RLD2-1学习强化学习设计器的目的与作用(7分钟)
6、RLD2-2设计器的基本框架及功能讲解(4分钟,网络上免费“试看”)
7、RLD2-3新创建环境与导入自己问题的环境(9钟,有程序)
8、RLD2-4新创建智能体及其超参数基本设置(9分钟,有程序)
9、RLD2-5智能体参数及双Q学习法与目标更新频率(8分钟)
10、RLD2-6Actor和Critic及其参数设置(11分钟)
11、RLD2-7ε-贪婪策略及其衰减率设置(7分钟)
12、RLD2-8OU随机噪声及其衰减率设置(7分钟)
第三章 训练智能体操作及训练参数设置(34分钟)
14、RLD3-1深度强化学习全部参数解读及训练智能体操作(12分钟)
15、RLD3-2训练参数设置及训练进程解读与分析(12分钟)
16、RLD3-3训练进程解读及预训练智能体保存(10分钟)
第四章 仿真测试智能体及测试参数设置(20分钟)
17、RLD4-1保存当前会话结果及仿真测试经验介绍(10分钟)
18、RLD4-2仿真参数设置及仿真测试结果解读分析(10分钟)
第五章 数据检查器操作及保存训练进程和仿真结果图像(39分钟)
19、RLD5-1训练进程图像保存及训练程序生成(12分钟,有程序)
20、RLD5-2仿真测试图像保存及测试程序生成(12分钟,有程序)
21、RLD5-3数据检查器简介及绘制回合6个子图(7分钟)
22、RLD5-4仿真测试图像和数据保存及比较操作(8分钟)
第六章 车杆平衡系统控制问题利用Simulink环境和DQN智能体训练仿真(33分钟)
23、RLD6-1目标要求及两类环境特点与六个智能体特点(6分钟,,网络上免费“试看”)
24、RLD6-2车杆平衡控制问题简介及设计器操作安排思路(6分钟,有程序)
25、RLD6-3新创建Simulink环境与DQN智能体及训练出错(7分钟,有程序)
26、RLD6-4纠错过程及2处改正到程序正常运行(5分钟,有程序)
27、RLD6-5训练失败到正常及3个结果保存(9分钟,有程序)
第七章 双积分系统控制问题利用MATLAB环境和PPO智能体训练仿真(31分钟)
28、RLD7-1双积分系统控制问题简介及设计器操作安排思路(7分钟,有程序)
29、RLD7-2新创建MATLAB环境与PPO智能体及参数设置(9分钟,有程序)
30、RLD7-3训练参数设置及停止条件(7分钟,有程序,网络上免费“试看”)
31、RLD7-4训练与仿真第2和第3方案及过程分析(8分钟,有程序)
第八章 四足机器人行走控制问题利用Simulink环境和DDPG智能体训练仿真(31分钟)
32、RLD8-1四足机器人快速行走控制问题简介及设计器操作思路(10分钟,有程序)
33、RLD8-2导入Simulink环境与导入DDPG智能体及参数设置(11分钟,有程序)
34、RLD8-3训练与仿真DDPG智能体过程分析及结果保存(10分钟,有程序)
第九章 四足机器人行走控制问题利用Simulink环境和TD3智能体训练仿真(47分钟)
35、RLD9-1TD3算法操作安排思路及运行自编程序再导入环境(8分钟,有程序)
36、RLD9-2创建TD3智能体及超参数设置解读与保存(6分钟,有程序,网络上免费“试看”)
37、RLD9-3训练TD3智能体和过程解读分析及机器人表现(11分钟,有程序)
38、RLD9-4训练与仿真TD3智能体过程分析及3个结果保存(10分钟,有程序)
39、RLD9-5训练与仿真3次继续或恢复等综合操作解读(12分钟,有程序)
五、下载文件
1、必先看_强化学习设计器使用及MATLAB程序视频学习指导.doc
2、RLD_PPT课件.rar
3、RLD_m.rar
六、各种算法视频课程及其到淘宝详情页链接
点击下列链接,即可进入淘宝教育【视频播放】页面,有免费的“试看视频”,可以“倍速”播放。
留意:【视频播放】页面右下角到【淘宝店铺详情页】拍宝贝。详情页介绍了你所关心的所有问题。
1、第2版卡尔曼滤波与应用和MATLAB程序详解视频科研算法辅导答疑
https://jiaoyu.taobao.com/course/TBJY_2835001?spm=qingketang.24510471.0.0.210251f8R2bkjx
2、第2.5版粒子滤波与应用和MATLAB程序详解视频科研技术算法
https://jiaoyu.taobao.com/course/QKT_3919002?spm=qingketang.24510471.0.0.491a51f85R0UQP
3、第2版小波分析与应用和MATLAB程序详解视频科研技术教育数学答疑
https://jiaoyu.taobao.com/course/QKT_3810002?spm=qingketang.24510471.0.0.4f2251f8ShzRhz
4、第3版经验模态分解和希尔伯特黄变换应用和MTALAB程序分析视频
https://jiaoyu.taobao.com/course/QKT_3400003?spm=qingketang.24510471.0.0.7b1151f8pGgiRs
5、第2版傅里叶变换傅立叶频率幅值信号分析算法教育视频和MTALAB程序
https://jiaoyu.taobao.com/course/QKT_1744006?spm=qingketang.24510471.0.0.788651f8Ci7JsF
6、非局部均值滤波类算法与应用和MATLAB程序详解视频科研技术算法
https://jiaoyu.taobao.com/course/QKT_3951003?spm=qingketang.24510471.0.0.71e351f8lh4a8P
7、第2版最小二乘法与MATLAB程序详解视频课程数据分析回归预测
https://jiaoyu.taobao.com/course/QKT_1882007?spm=qingketang.24510471.0.0.8a7b51f8IBe8Lv
8、随机变量数据分析与处理和MATLAB程序详解视频教程
https://jiaoyu.taobao.com/course/QKT_4206006?spm=qingketang.24510471.0.0.299b51f8ofqosP
9、第2版改进的经验模态分解(MEEMD)与排列熵(PE)算法和MATLAB程序详解视频
https://jiaoyu.taobao.com/course/TBJY_3147001?spm=qingketang.24510471.0.0.333d51f807CiJU
10、第2版BP神经网络及其应用与MATLAB命令详解视频
https://jiaoyu.taobao.com/course/QKT_3694013?spm=qingketang.24510471.0.0.10cc51f8zEZ816
11、第2版遗传算法(GA)及其约束条件工具箱应用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/TBJY_3143136?spm=qingketang.24510471.0.0.71fb51f8I6BG32
12、第2.5版卷积神经网络(CNN)及其分类识别应用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_3785005?spm=qingketang.24510471.0.0.517f51f8J2JHYF
13、支持向量机(SVM)及其分类识别应用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_3919001?spm=qingketang.24510471.0.0.59fa51f8dgKDM5
14、粒子群优化算法(PSO)及其路径配置优化应用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_4125008?spm=qingketang.24510471.0.0.12fb51f8Cl4dh5
15、遗传算法优化BP神经网络及其应用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/TBJY_3026040?spm=qingketang.24510471.0.0.338e51f8NN5JGt
16、模拟退火算法(SA)及其应用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_3384003?spm=qingketang.24510471.0.0.6b6351f8pEKtjq
17、第2版变分模态分解(VMD)及其应用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_1572002?spm=qingketang.24510471.0.0.160551f8qoeKDU
18、循环神经网络(RNN)及其应用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_3675001?spm=qingketang.24510471.0.0.47d351f83DgbG1
19、长短时记忆网络(GAN)及其应用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/TBJY_3414002?spm=qingketang.24510471.0.0.15d151f85pWtbm
20、生成式对抗网络(GAN)及其应用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/TBJY_3084112?spm=qingketang.24510471.0.0.77f351f8J3ewfJ
21、强化学习(RL)及其应用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_3179062?spm=qingketang.24510471.0.0.340751f83r7clZ
22、深度强化学习(DRL)及其应用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_3551159?spm=qingketang.24510471.0.0.20d051f8jo5prn
23、辅助正则粒子滤波与应用和MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_3675002?spm=qingketang.24510471.0.0.1e1d51f8oJ3B1f
24、交易操作用深度强化学习AC算法与MATLAB程序
25、第3版Python程序及傅里叶变换与应用详解视频
https://jiaoyu.taobao.com/course/QKT_4862067?spm=qingketang.24510471.0.0.41fc51f8l9DBBC
26、交叉验证优化3个神经网络参数与应用和MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_4660145?spm=2013.1.0.0.7e182286IIvqif
27、粒子群算法优化支持向量机和MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_4498113?spm=qingketang.24510471.0.0.291a51f8ZVY9Rj
28、多目标遗传算法优化支持向量机和MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_5063115?spm=qingketang.24510471.0.0.2f2051f8bHrtcZ
29、粒子群算法优化PID控制算法和MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_5341013?spm=qingketang.24510471.0.0.429851f8WFtx4g
30、强化学习设计器使用与MATLAB程序详解视频
https://jiaoyu.taobao.com/course/QKT_5262003?spm=qingketang.24510471.0.0.474651f8RlQkTZ
31、如何创建强化学习问题的MATLAB环境及程序详解视频
https://jiaoyu.taobao.com/course/QKT_5285024?spm=qingketang.24510471.0.0.70b951f8926O6T
32、如何创建强化学习问题的Simulink环境及程序详解视频
https://jiaoyu.taobao.com/course/QKT_4422023?spm=qingketang.24510471.0.0.433651f8ynib9r
33、B站:傅里叶变换快速入门及Python程序绘图详解视频
https://www.bilibili.com/cheese/play/ss20232
34、B站:强化学习设计器操作简明版详解视频
https://www.bilibili.com/cheese/play/ss20138
35、B站:BP神经网络MATLAB快速入门了解神经网络知识
https://www.bilibili.com/cheese/play/ss23543
36、B站:创建强化学习MATLAB环境求解自己问题详解视频
https://www.bilibili.com/cheese/play/ss19900
37、B站:变分模态分解原创优良降噪整形算法处理心电图信号与MATLAB程序视频
https://www.bilibili.com/cheese/play/ss28622
38、B站:变分模态分解原创优良降噪光滑算法处理海洋内波数据与MATLAB程序视频
https://www.bilibili.com/cheese/play/ss28565
39、B站:BP神经网络预测上证开盘指数与MATLAB程序视频
https://www.bilibili.com/cheese/play/ss28471
40、B站:BP神经网络遗传算法求解无目标函数表达式问题与MATLAB程序视频
https://www.bilibili.com/cheese/play/ss28950
41、B站:DDPG算法实现双积分系统控制与MATLAB程序详解视频
https://www.bilibili.com/cheese/play/ss28770
42、B站:多目标遗传算法求解资源优化配置问题与MATLAB程序详解视频
https://www.bilibili.com/cheese/play/ss32166
43、B站:多尺度排列熵算法与MATLAB详解视频
https://www.bilibili.com/cheese/play/ss32251
44、B站:粒子群算法优化支持向量机预测上证股指和MATLAB程序详解视频
https://www.bilibili.com/cheese/play/ss32383
45、B站:扩展卡尔曼滤波方法利用距离实现实时跟踪与MATLAB程序视频
https://www.bilibili.com/cheese/play/ss32638
46、B站:观测方位利用扩展卡尔曼滤波方法实现实时跟踪与MATLAB程序视频
https://www.bilibili.com/cheese/play/ss32732
47、B站:无迹卡尔曼滤波方法利用距离实现实时跟踪与MATLAB程序视频
https://www.bilibili.com/cheese/play/ss32850
48、B站:卡尔曼滤波方法实现自由落体视频实时跟踪与MATLAB程序视频