强化学习工程师深度实战课程 强化学习基础+进阶实战+核心算法+全域网络架构技术
强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
课程内容从强化学习的基础到进阶实战,每个阶段都有非常详细的指导和教学,可以很好的加深同学们对强化学习框架,网络流程,运行策略的理解,从宏观到细节,特别细致,对于想要快速在工作中运用强化学习的同学很有帮助。
===============课程目录===============
├─(1) 1-2 一张图通俗解释强化学习.mp4
├─(2) 1-3 强化学习的指导依据.mp4
├─(3) 1-4 强化学习AI游戏DEMO.mp4
├─(4) 1-5 应用领域简介.mp4
├─(5) 1-6 强化学习工作流程.mp4
├─(6) 1-7 计算机眼中的状态与行为.mp4
├─(7) 10-1 PyTorch框架发展趋势简介.mp4
├─(8) 10-2 框架安装方法(CPU与GPU版本).mp4
├─(9) 10-3 PyTorch基本操作简介.mp4
├─(10) 10-4 自动求导机制.mp4
├─(11) 10-5 线性回归DEMO-数据与参数配置.mp4
├─(12) 10-6 线性回归DEMO-训练回归模型.mp4
├─(13) 10-7 常见tensor格式.mp4
├─(14) 10-8 Hub模块简介.mp4
├─(15) 11-1 卷积网络参数定义.mp4
├─(16) 11-10 加载训练好的网络模型.mp4
├─(17) 11-11 优化器模块配置.mp4
├─(18) 11-12 实现训练模块.mp4
├─(19) 11-13 训练结果与模型保存.mp4
├─(20) 11-14 加载模型对测试数据进行预测.mp4
├─(21) 11-15 额外补充-Resnet论文解读.mp4
├─(22) 11-16 额外补充-Resnet网络架构解读.mp4
├─(23) 11-2 网络流程解读.mp4
├─(24) 11-3 Vision模块功能解读.mp4
├─(25) 11-4 分类任务数据集定义与配置.mp4
├─(26) 11-5 图像增强的作用.mp4
├─(27) 11-6 数据预处理与数据增强模块.mp4
├─(28) 11-7 Batch数据制作.mp4
├─(29) 11-8 迁移学习的目标.mp4
├─(30) 11-9 迁移学习策略.mp4
├─(31) 2-1 基本情况介绍.mp4
├─(32) 2-2 与环境交互得到所需数据.mp4
├─(33) 2-3 要完成的目标分析.mp4
├─(34) 2-4 策略梯度推导.mp4
├─(35) 2-5 baseline方法.mp4
├─(36) 2-6 OnPolicy与OffPolicy策略.mp4
├─(37) 2-7 importance sampling的作用.mp4
├─(38) 2-8 PPO算法整体思路解析.mp4
├─(39) 3-1 Critic的作用与效果.mp4
├─(40) 3-2 PPO2版本公式解读.mp4
├─(41) 3-3 参数与网络结构定义.mp4
├─(42) 3-4 得到动作结果.mp4
├─(43) 3-5 奖励获得与计算.mp4
├─(44) 3-6 参数迭代与更新.mp4
├─(45) 4-1 算法原理通俗解读.mp4
├─(46) 4-2 目标函数与公式解析.mp4
├─(47) 4-3 Qlearning算法实例解读.mp4
├─(48) 4-4 Q值迭代求解.mp4
├─(49) 4-5 DQN简介.mp4
├─(50) 5-1 整体任务流程演示.mp4
├─(51) 5-2 探索与action获取.mp4
├─(52) 5-3 计算target值.mp4
├─(53) 5-4 训练与更新.mp4
├─(54) 6-1 DoubleDqn要解决的问题.mp4
├─(55) 6-2 DuelingDqn改进方法.mp4
├─(56) 6-3 Dueling整体网络架构分析.mp4
├─(57) 6-4 MultiSetp策略.mp4
├─(58) 6-5 连续动作处理方法.mp4
├─(59) 7-1 AC算法回顾与知识点总结.mp4
├─(60) 7-2 优势函数解读与分析.mp4
├─(61) 7-3 计算流程实例.mp4
├─(62) 7-4 A3C整体架构分析.mp4
├─(63) 7-5 损失函数整理.mp4
├─(64) 8-1 整体流程与环境配置.mp4
├─(65) 8-2 启动游戏环境.mp4
├─(66) 8-3 初始化局部模型并加载参数.mp4
├─(67) 8-4 要计算的指标回顾.mp4
├─(68) 8-5 与环境交互得到训练数据.mp4
├─(69) 8-6 训练网络模型.mp4
├─(70) 9-1 卷积神经网络应用领域.mp4
├─(71) 9-10 VGG网络架构.mp4
├─(72) 9-11 残差网络Resnet.mp4
├─(73) 9-12 感受野的作用.mp4
├─(74) 9-2 卷积的作用.mp4
├─(75) 9-3 卷积特征值计算方法.mp4
├─(76) 9-4 得到特征图表示.mp4
├─(77) 9-5 步长与卷积核大小对结果的影响.mp4
├─(78) 9-6 边缘填充方法.mp4
├─(79) 9-7 特征图尺寸计算与参数共享.mp4
├─(80) 9-8 池化层的作用.mp4
├─(81) 9-9 整体网络架构.mp4
(1)\课件;目录中文件数:7个
├─(82) 第一章:强化学习简介及其应用.pdf
├─(83) 第七章:Actor-Critic算法分析(A3C).pdf
├─(84) 第三章:策略梯度实战-月球登陆器训练实例.zip
├─(85) 第二章:PPO算法与公式推导.pdf
├─(86) 第五章:DQN算法实例演示.zip
├─(87) 第八章:A3C算法玩转超级马里奥.zip
├─(88) 第四章:DQN算法.pdf
还没有评论,来说两句吧...