SRE онлайн‑интенсив — это практико‑ориентированное обучение, где вы погружаетесь в реальные задачи поддержки микросервисной инфраструктуры, учитесь работать с надежностью как с продуктом и осваиваете инструменты, которые используют SRE‑команды в ведущих IT‑компаниях.
Что представляет собой SRE‑интенсив
Этот интенсив создан для специалистов, которые хотят системно понимать надежность сервисов, уметь проектировать устойчивую архитектуру и грамотно реагировать на инциденты. Программа сочетает теорию, практику, эксперименты с отказами и четко структурированный разбор реальных кейсов из SRE‑мира.
Кому подойдет этот курс
Обучение рассчитано на начинающих и действующих инженеров поддержки, DevOps‑специалистов, разработчиков и всех, кто работает с высоконагруженными сервисами и стремится повысить их доступность и стабильность.
Какие навыки вы получите
- Проектирование и поддержка распределенных систем на основе SRE‑подхода.
- Работа с метриками SLI, SLO, SLA и error budget.
- Настройка мониторинга, алертинга и управление инцидентами.
- Оптимизация инфраструктуры под реальные нагрузки.
- Анализ и предотвращение отказов, автоматизация рутинных процессов.
Что вы будете делать на интенсиве
Строить
Вы сформулируете SLI, SLO и SLA для сайта с микросервисной архитектурой, создадите инфраструктуру, способную выдерживать реальные нагрузки, настроите мониторинг, алертинг и развернете сервис в рабочей среде.
Ломать
Вы исследуете факторы, которые приводят к ухудшению SLO: ошибки кода, сбои инфраструктуры, рост трафика или DDoS. Разберетесь в работе с отказоустойчивостью, error budget и методах стресс‑тестирования сервисов.
Чинить
Научитесь организовывать оперативную ликвидацию инцидентов: подключать нужных коллег, уведомлять stakeholders и правильно расставлять приоритеты. Попробуете восстановить сервис в условиях жесткого тайминга.
Изучать
Разберете инциденты: причины возникновения, процесс устранения, выводы. Примете решения по улучшению архитектуры, процессов разработки, эксплуатации и автоматизации на основе SRE‑подхода.
Требования к участникам
- Уверенная работа с Linux.
- Знание любого языка программирования на уровне Junior.
- Навыки автоматизации в GitLab.
- Опыт работы с мониторингом Prometheus.
- Базовые навыки работы с Kubernetes.
Почему этот курс полезен для вашей карьеры
SRE‑специалисты востребованы во всех технологичных компаниях. Освоив методологию SRE, вы сможете проектировать надежные системы, устранять инциденты быстрее и повышать устойчивость сервисов — навыки, которые напрямую влияют на бизнес и ценятся в индустрии.
После интенсива вы сможете
- Уверенно работать в командах DevOps/SRE.
- Поддерживать и развивать сложные распределенные системы.
- Автоматизировать рутинные процессы и повышать эффективность команд.
- Создавать архитектуру, ориентированную на надежность.