
- Категории
- Источники
- Все курсы
- Разделы
- Книги
-
Apache Airflow - это независимый от платформы инструмент для оркестрации рабочих процессов, который предоставляет широкие возможности для создания и мониторинга как потоковых, так и пакетных (batch) пайплайнов. Даже самые сложные процессы легко реализуются с его помощью - и всё это с поддержкой ключевых платформ и инструментов мира Data Engineering, включая AWS, Google Cloud и другие.Airflow позволяет не только планировать и управлять процессами,
API - это основа любой современной платформы данных. Вы либо предоставляете API для клиентов, либо сами используете внешние API. В любом случае, важно уметь с ними работать.В этом курсе вы освоите все базовые навыки, необходимые для проектирования, разработки и деплоя API. Мы будем использовать FastAPI - современный фреймворк для Python, идеально подходящий для быстрого создания и тестирования API. Также вы научитесь использовать Docker для разве
В современном мире, где данные играют ключевую роль, эффективная организация информации - основа для качественной аналитики и построения отчётов. Многомерное моделирование данных - это важный подход, позволяющий структурировать данные для быстрого доступа и принятия обоснованных решений.Этот курс представляет собой подробное введение в основные концепции размерного моделирования. Вы узнаете, как работают фактные и размерные таблицы, что такое мед
Реляционное моделирование широко применяется при построении транзакционных баз данных. Возможно, вы скажете: «Но я не собираюсь становиться backend-инженером». Однако знание не только того, как перемещать данные, но и как грамотно их хранить, - ключевой навык. Это включает в себя создание масштабируемой структуры данных, обеспечивающей быструю обработку запросов и эффективное извлечение информации.
Во время моих коучинг-сессий снова и снова всплывает одна важная тема - проектирование схем. Поэтому я решил создать отдельный курс в академии, чтобы подробнее объяснить, как разрабатывать схемы данных для различных хранилищ.В качестве учебного примера мы будем использовать e-commerce-датасет, знакомый вам из других курсов. Я также включил реальные схемы из коучинга, чтобы показать, как проектирование может выглядеть в разных сценариях.
Одна из ключевых задач при создании платформы данных и пайплайнов - это выбор подходящих хранилищ данных. Именно этой теме и посвящён данный курс.Мы рассмотрим реляционные и NoSQL базы данных, а также хранилища данных (data warehouses) и озёра данных (data lakes). Вы узнаете, когда стоит использовать тот или иной тип хранилища и как правильно интегрировать его в свою архитектуру.После прохождения курса вы будете понимать, как хранить данные и как
Надёжная концепция безопасности для платформ и пайплайнов - критически важна. Почти каждый может собрать Proof of Concept без должного уровня защиты, но если вы хотите стать хорошим дата-инженером, вы обязаны понимать, как защищать свою работу и данные.Именно поэтому я создал этот курс по безопасности - чтобы вы были хорошо подготовлены к своей роли дата-инженера. В курсе мы рассмотрим базовые, но крайне важные темы, с которыми вы будете сталкива
Дата-пайплайны - ключевой элемент любой платформы Data Science. Без них невозможна ни загрузка данных, ни запуск моделей машинного обучения. Этот практический курс продолжительностью 170 минут научит вас создавать потоковые (streaming), пакетные (batch) и машинные (ML) пайплайны, используя проверенные шаблоны и примеры для популярных облачных платформ.
Инженерия данных - это не просто перемещение информации из одного места в другое. Это создание надёжных, масштабируемых и эффективных систем, которые превращают сырые данные в ценные инсайты. Но на практике многие инженеры сталкиваются с хаотичными задачами, переключаются с одной проблемы на другую - без чёткой стратегии и структуры.Именно поэтому мы создали курс «Как стать лучшим инженером по данным». Он поможет вам справляться с реальными вызов
Если вы хотите вывести свои навыки в Data Engineering на новый уровень - вы по адресу. Python стал основным языком для анализа данных и машинного обучения, а в рамках этого курса вы научитесь эффективно использовать его для создания надёжных дата-пайплайнов и обработки данных.