Главная страницаКатегория машинное обучениеReinforcement Learning

Reinforcement Learning

Name: Reinforcement Learning
Price: 13 USD
Rating: 5 (2 reviews)

OTUS

★5 (всего оценок - 2)

Продолжительность

35 ч 20 мин

Категория

Машинное обучение

Количество уроков

24 Видео

Дата добавления

15 апр. 2026 г., 22:49

Язык

Русский

Дата обновления

30 апр. 2026 г., 01:58

Reinforcement Learning — это фундамент для создания систем, которые учатся принимать решения самостоятельно.

Кому подойдет этот курс

ML-инженерам

Курс поможет внедрять RL в продакшн: от оптимизации и управления ресурсами до алгоритмического трейдинга и работы со сложными динамическими системами.

Data Science специалистам

Подходит для тех, кто создает адаптивные модели и системы принятия решений, а также работает с рекомендательными системами, симуляциями и связкой RL + NLP.

Fullstack-разработчикам

Будет полезен разработчикам, которые хотят переходить в ML-направление или создавать интеллектуальные приложения: игровые AI, автоматизацию действий, адаптивные интерфейсы.

Системным аналитикам

Курс позволяет глубже понимать принципы проектирования бизнес-решений на основе RL: в финансах, логистике, автоматизации процессов и анализе поведения сложных систем.

Deep Learning инженерам

Отличный выбор для тех, кто работает с Deep RL в робототехнике, игровой индустрии, системах компьютерного зрения или исследовательских проектах.

Необходимые знания перед стартом

базовые навыки Python;
понимание линейной алгебры (векторы, матрицы, градиентные методы);
опыт работы с библиотеками машинного обучения: pandas, sklearn, модели регрессии.

Что такое Reinforcement Learning

Reinforcement Learning — парадигма машинного обучения, в которой агент взаимодействует со средой, обучаясь методом проб и ошибок. RL используется в десятках индустрий благодаря способности оптимизировать решения в неопределённых и динамичных условиях.

создание игровых ботов, которые учатся стратегии и превосходят игроков;
обучение автономных роботов и дронов;
алгоритмический трейдинг и управление портфелями;
персонализация товаров и контента в e-commerce;
оптимизация производственных цепочек и энергопотребления.

Чему вы научитесь

Базовые и классические методы RL

понимать основы агента, среды, состояния и награды;
применять Q-learning, SARSA, Monte Carlo;
моделировать среды и настраивать агентов под задачи.

Deep Reinforcement Learning

использовать нейросетевые модели в задачах RL;
реализовывать DQN, PPO и современные алгоритмы Deep RL;
работать с фреймворками для RL: Stable Baselines, RLlib.

Продвинутые методы RL

осваивать оптимальное управление и динамические системы;
использовать методы со скользящим горизонтом;
разрабатывать решения на основе Model-based RL.

Что вы сможете делать после курса

создавать игровых ботов и адаптивных NPC;
разрабатывать автономных роботов и системы навигации;
строить алгоритмические торговые стратегии;
создавать персонализированные рекомендательные модели;
оптимизировать процессы и системы управления в компании.

Практическая часть

После каждого вебинара вы получаете Jupyter Notebook с подробным разбором реального кейса. Это помогает закрепить теорию, понять механизмы работы агентов и быстро освоить современные инструменты Reinforcement Learning.

Это пробный урок. Оформите подписку, чтобы получить доступ ко всем материалам курса. Премиум

Урок 1. 01:34:00
01 Знакомство с Reinforcement Learning
Урок 2. 01:39:14
02 Ключевые понятия RL. агент, среда, награда, политика. Построение среды
Урок 3. 01:42:29
03 Основные алгоритмы RL. Value based
Урок 4. 01:29:56
04 Основные алгоритмы RL. Policy based
Урок 5. 01:19:31
05 Введение в Deep Reinforcement Learning
Урок 6. 01:32:32
06 Deep Q-Network (DQN) алгоритм
Урок 7. 00:54:30
07 Deep Policy Gradient (PG) алгоритм
Урок 8. 01:27:54
08 Actor-Critic алгоритм
Урок 9. 01:06:44
09 TRPO -- PPO
Урок 10. 01:28:13
10 DDPG -- TD3 -- LSTM-TD3
Урок 11. 01:44:56
11 Обучение с использованием модели среды (model-based rl)
Урок 12. 01:47:40
12 Model-based, часть 2
Урок 13. 01:43:10
13 Иерархическое обучение с подкреплением
Урок 14. 00:54:51
14 Выбор темы и организация проектной работы
Урок 15. 01:31:06
15 Многоагентное обучение и кооперация агентов
Урок 16. 01:34:40
16 Трансформеры в RL- decision transformers и action transformers
Урок 17. 00:49:13
17 Применение RL в игровой индустрии
Урок 18. 02:03:55
18 Применение RL в робототехнике
Урок 19. 01:34:54
19 RL в рекомендательных системах
Урок 20. 01:55:47
20 RL в задаче скоринга
Урок 21. 01:45:21
21 Применение RL в управлении финансовым портфелем
Урок 22. 00:52:31
22 Консультация по проектам и домашним заданиям
Урок 23. 02:15:31
23 Предзащита
Урок 24. 00:31:53
24 Защита проектных работ. Подведение итогов курса

Автор - OTUS

OTUS

Otus - профессиональная площадка для обучения разработчиков. В основном предлагает курсы по Java, python, C++ и бек-енд направление разработки.

+151

Комментарии

amitsa
16 апр. 2026 г., 17:06
Hi is there any way to access these courses in English please.
Thankyou