
slurm.io
Интенсивы и онлайн-курсы от компании Southbridge: Kubernetes, DevOps, Docker, Ansible, Ceph.
Знакомимся с Prometheus. Разбираемся с нюансами, не описанными в документации. Изучаем тонкости настройки Prometheus. Понимать принципы работы мониторинга должны все, кто работает над проектом: разработчики, инженеры эксплуатации. Онлайн-курс по Prometheus позволит быстро познакомиться с этим инструментом.
Мы разберем, чем Prometheus отличается от других систем мониторинга, как его установить и настроить, какие метрики стоит собирать с его помощью, а какие - нет, как хранить метрики, как писать запросы на PromQL, как визуализировать мониторинг с помощью Grafana и как настроить алерты.
Требования к участнику
Владение основами Linux:
Интенсивы и онлайн-курсы от компании Southbridge: Kubernetes, DevOps, Docker, Ansible, Ceph.
На примере одной компании изучаем переход от деплоя раз в месяц к деплою раз в час и взгляд на DevOps со всех точек зрения. Сторона заказчика: как быстрее и дешевле решать бизнес-задачи, выкатывать новые фичи и исправлять баги. Мы расскажем и покажем как деплоить код без downtime.
Вы заинтересованы в развертывании Prometheus в Kubernetes? Если так, то это курс для вас. Этот курс охватывает основы Prometheus, который включает его архитектуру и компоненты, такие как экспортеры, клиентские библиотеки и оповещения. Оттуда вы узнаете, как развернуть Prometheus в Kubernetes и настроить Prometheus для мониторинга кластера, а также приложений, развернутых на нем.
Для тех, кто хочет администрировать десятки серверов и спокойно спать по ночам. Вы получите стандарты работы, к которым компания Southbridge пришла за 10 лет, настроив тысячи серверов и решив миллионы проблем. Мы передадим вам свои инструменты, регламенты, подходы, инструкции и скрипты.
Вы погрузитесь в теорию и практику SRE: будете поддерживать сайт, состоящий из нескольких микросервисов. Научитесь правильно распределять ограниченные ресурсы для обеспечения быстродействия, отказоустойчивости и доступности сайта для максимальной надежности, достаточной, чтобы были довольны пользователи.
«Prometheus — это инструмент с открытым исходным кодом, используемый для мониторинга событий и оповещения». Prometheus изменил способ мониторинга систем и поэтому стал топовым проектом Cloud Native Computing Foundation (CNCF).