
- Категории
- Источники
- Все курсы
- Разделы
- Книги
-
Во время моих коучинг-сессий снова и снова всплывает одна важная тема - проектирование схем. Поэтому я решил создать отдельный курс в академии, чтобы подробнее объяснить, как разрабатывать схемы данных для различных хранилищ.В качестве учебного примера мы будем использовать e-commerce-датасет, знакомый вам из других курсов. Я также включил реальные схемы из коучинга, чтобы показать, как проектирование может выглядеть в разных сценариях.
Одна из ключевых задач при создании платформы данных и пайплайнов - это выбор подходящих хранилищ данных. Именно этой теме и посвящён данный курс.Мы рассмотрим реляционные и NoSQL базы данных, а также хранилища данных (data warehouses) и озёра данных (data lakes). Вы узнаете, когда стоит использовать тот или иной тип хранилища и как правильно интегрировать его в свою архитектуру.После прохождения курса вы будете понимать, как хранить данные и как
Надёжная концепция безопасности для платформ и пайплайнов - критически важна. Почти каждый может собрать Proof of Concept без должного уровня защиты, но если вы хотите стать хорошим дата-инженером, вы обязаны понимать, как защищать свою работу и данные.Именно поэтому я создал этот курс по безопасности - чтобы вы были хорошо подготовлены к своей роли дата-инженера. В курсе мы рассмотрим базовые, но крайне важные темы, с которыми вы будете сталкива
Дата-пайплайны - ключевой элемент любой платформы Data Science. Без них невозможна ни загрузка данных, ни запуск моделей машинного обучения. Этот практический курс продолжительностью 170 минут научит вас создавать потоковые (streaming), пакетные (batch) и машинные (ML) пайплайны, используя проверенные шаблоны и примеры для популярных облачных платформ.
Инженерия данных - это не просто перемещение информации из одного места в другое. Это создание надёжных, масштабируемых и эффективных систем, которые превращают сырые данные в ценные инсайты. Но на практике многие инженеры сталкиваются с хаотичными задачами, переключаются с одной проблемы на другую - без чёткой стратегии и структуры.Именно поэтому мы создали курс «Как стать лучшим инженером по данным». Он поможет вам справляться с реальными вызов
Если вы хотите вывести свои навыки в Data Engineering на новый уровень - вы по адресу. Python стал основным языком для анализа данных и машинного обучения, а в рамках этого курса вы научитесь эффективно использовать его для создания надёжных дата-пайплайнов и обработки данных.
Этот вводный курс поможет вам лучше понять, что такое инженерия данных и какую роль в области Data Science играет инженер по данным. Для начала вы узнаете немного обо мне - вашем инструкторе на этом пути. Я расскажу о своём профессиональном опыте и о том, как пришёл в сферу Data Engineering.
Курс «Математика для анализа данных» от Яндекс Практикума создан для тех, кто хочет углубить свои знания в аналитике и сфере Data Science. Программа курса охватывает основные разделы математики, необходимые для работы в этих областях, такие как линейная алгебра, математический анализ, теория вероятностей и статистика. Обучение организовано так, чтобы студенты могли изучать материалы в удобном для себя темпе, без жестких дедлайнов и расписания. Ка
«Создание большой языковой модели с нуля» - это практическое руководство, которое шаг за шагом научит вас создавать, обучать и настраивать большие языковые модели (LLMs).В книге вы пройдете весь путь - от проектирования модели до предобучения на общем корпусе данных и настройки под конкретные задачи. Каждый этап сопровождается понятными объяснениями, диаграммами и примерами.
Примеры из практики в A/B тестировании - это курс, который познакомит вас с методами проектирования, проведения и анализа экспериментов с использованием A/B тестов, чтобы вы могли принимать обоснованные решения на основе данных. Присоединяйтесь к курсу, чтобы узнать, как эффективно проектировать эксперименты, анализировать результаты и внедрять улучшения с помощью A/B тестирования.