Это пробный урок. Оформите подписку, чтобы получить доступ ко всем материалам курса. Премиум

  1. Урок 1. 01:34:00
    01 Знакомство с Reinforcement Learning
  2. Урок 2. 01:39:14
    02 Ключевые понятия RL. агент, среда, награда, политика. Построение среды
  3. Урок 3. 01:42:29
    03 Основные алгоритмы RL. Value based
  4. Урок 4. 01:29:56
    04 Основные алгоритмы RL. Policy based
  5. Урок 5. 01:19:31
    05 Введение в Deep Reinforcement Learning
  6. Урок 6. 01:32:32
    06 Deep Q-Network (DQN) алгоритм
  7. Урок 7. 00:54:30
    07 Deep Policy Gradient (PG) алгоритм
  8. Урок 8. 01:27:54
    08 Actor-Critic алгоритм
  9. Урок 9. 01:06:44
    09 TRPO -- PPO
  10. Урок 10. 01:28:13
    10 DDPG -- TD3 -- LSTM-TD3
  11. Урок 11. 01:44:56
    11 Обучение с использованием модели среды (model-based rl)
  12. Урок 12. 01:47:40
    12 Model-based, часть 2
  13. Урок 13. 01:43:10
    13 Иерархическое обучение с подкреплением
  14. Урок 14. 00:54:51
    14 Выбор темы и организация проектной работы
  15. Урок 15. 01:31:06
    15 Многоагентное обучение и кооперация агентов
  16. Урок 16. 01:34:40
    16 Трансформеры в RL- decision transformers и action transformers
  17. Урок 17. 00:49:13
    17 Применение RL в игровой индустрии
  18. Урок 18. 02:03:55
    18 Применение RL в робототехнике
  19. Урок 19. 01:34:54
    19 RL в рекомендательных системах
  20. Урок 20. 01:55:47
    20 RL в задаче скоринга
  21. Урок 21. 01:45:21
    21 Применение RL в управлении финансовым портфелем
  22. Урок 22. 00:52:31
    22 Консультация по проектам и домашним заданиям
  23. Урок 23. 02:15:31
    23 Предзащита
  24. Урок 24. 00:31:53
    24 Защита проектных работ. Подведение итогов курса