Podlodka Techlead Crew #4 — интенсивная неделя погружения в observability, мониторинг, алертинг и tracing, где опытные инженеры делятся реальными практиками внедрения SRE и повышением надежности систем. Это идеальный формат для тех, кто хочет укрепить инженерную культуру, научиться работать с метриками и понять, как построить наблюдаемость на уровне топовых компаний.
Что вас ждёт на программе
Участники получают доступ к 11 часам экспертных сессий, подробным разбором практических кейсов и живому общению в сообществе. Программа помогает системно прокачать навыки работы с observability и взглянуть на SRE глазами инженеров из Google, Tinkoff, Ozon, Datadog, Bolt и других компаний.
Ключевые темы курса
SRE-подход и принципы, которыми руководствуется Google.
Метрики и мониторинг: что измерять, как выбирать метрики и какие ошибки совершают команды.
Tracing и распределённые системы: как извлекать ценность из трассировок.
Практики надежности: SLA, SLO, error budget, методы измерения надежности.
Оперирование инцидентами: разбор post mortem и работа над ошибками.
SRE-культура и то, как она внедряется в компаниях разных масштабов.
Спикеры и формат
Сессии ведут практикующие инженеры и руководители, которые ежедневно работают с высоконагруженными системами и выстраивают процессы SRE в крупных компаниях.
Доклады и активности
«SRE. Чему нас научил Google» — Дмитрий Масленников (Tinkoff, ex-Google)
«Какие такие Метрики или как делать не надо» — Маргарита Ольшанская (Bolt)
«Измерение надежности системы» — Павел Лакосников (Авито)
Круглый стол: «Как устроено SRE в разных компаниях» — Д. Масленников, М. Фесенко, С. Бухаров, М. Гусев
«Какую (ещё) пользу можно извлечь из распределённых трассировок?» — Григорий Кошелев (Контур)
«Как мы структурировали хаос в Озоне» — Дина Сафина (Ozon)
Интервью: «SRE культура» — Максим Гусев (Финам)
«SRE: Что это и как выглядит готовое блюдо» — Ганна Новикова (Intergiro)
Воркшоп: «Разбираем Post mortem» — Олег Федоткин (СберМаркет)
«Когда вы перестанете косячить на проде?» — Михаил Дружинин (Datadog)
Для кого подходит
Программа будет особенно полезна:
техлидам и тимлидам, выстраивающим инженерные процессы;
SRE- и DevOps-инженерам;
разработчикам, которым важно понимать работу продакшена и снижать количество инцидентов;
всем, кто хочет улучшить наблюдаемость и надежность своих систем.
Какие навыки вы получите
После прохождения программы участники:
понимают, как строится инфраструктура наблюдаемости;
умеют работать с метриками, логированием и трассировками;
знают, как внедрять SRE-практики в команду;
умеют проводить post mortem и предотвращать повтор инцидентов;
получают широкий набор инструментов для повышения надежности продукта.
Это пробный урок. Оформите подписку, чтобы получить доступ ко всем материалам курса. Премиум
Ограничение времени просмотра
Вы можете просматривать пробный урок только 10 минут. Получите полный доступ, чтобы смотреть без ограничений.
О формате наших выпусковНаши выпуски — это глубокое погружение в тему вместе с приглашённым экспертом. В каждом эпизоде мы зовём интересных и известных профессионалов из различных областей.Мы обсуждаем архитектуру, делимся реальным опытом промышленной разработки и спорим на самые актуальные и горячие темы.