Andreas Kretz

Я - старший инженер по данным и тренер, техноэнтузиаст и отец. Уже более десяти лет я увлечён Data Engineering. Сначала я стал инженером по данным самоучкой, а затем возглавил команду инженеров по данным в крупной компании. Когда я понял, насколько велика потребность в обучении в этой сфере, я последовал за своей страстью и основал собственную Академию Data Engineering. С тех пор я помог более чем 2 000 студентам достичь своих целей.

272

Курсы от Andreas Kretz

Изображение курса Создание локальной системы RAG на основе LlamaIndex и Ollama

Andreas Kretz

10 окт. 2025 г., 01:41

Другое (ИИ)

Создание локальной системы RAG на основе LlamaIndex и Ollama

GenAI RAG with LlamaIndex, Ollama and Elasticsearch

Retrieval-Augmented Generation (RAG) - это следующий практический шаг после семантического поиска и индексации. В этом курсе вы создадите полноценный локальный RAG-конвейер, который обрабатывает PDF-файлы, разбивает тексты на фрагменты, сохраняет векторы в Elasticsearch, извлекает релевантный контекст и генерирует обоснованные ответы с помощью модели Mistral, запущенной локально через Ollama.Мы пройдём путь от начала до конца на конкретном сценар

Изображение курса Скрытый фундамент генеративного ИИ

Andreas Kretz

9 сент. 2025 г., 13:45

PythonДругое (ИИ)

Скрытый фундамент генеративного ИИ

The Hidden Foundation of GenAI

Генеративный ИИ сегодня повсюду, но лишь немногие понимают фундаментальные концепции, на которых он держится. «Скрытый фундамент GenAI» - это отправная точка для тех, кто хочет по-настоящему разобраться, что стоит за LLM, векторным поиском и семантическим пониманием. Курс специально создан для инженеров данных и фокусируется на эмбеддингах - одном из важнейших (и самых неправильно трактуемых) строительных блоков любой GenAI-системы.Вместо перегру

Изображение курса Семантическая индексация и поиск логов

Andreas Kretz

9 сент. 2025 г., 13:18

Обработка и анализ данныхДругое (ИИ)

Семантическая индексация и поиск логов

Semantic Log Indexing & Search

Семантический поиск - один из самых практичных способов применения генеративного ИИ в реальных проектах по обработке данных. В этом курсе мы выходим за рамки базового знакомства с эмбеддингами (из курса The Hidden Foundation of GenAI) и начинаем использовать их на практике. Вы научитесь строить полноценный конвейер семантического поиска с нуля: от создания эмбеддингов и их хранения в векторной базе данных до выполнения запросов на естественном яз

Изображение курса Azure Data Pipelines с Terraform

Andreas Kretz

29 мая 2025 г., 23:56

AzureОбработка и анализ данныхTerraform

Azure Data Pipelines с Terraform

Azure Data Pipelines with Terraform

Azure становится всё более популярной платформой для компаний, использующих экосистему Microsoft365. Если вы хотите прокачать свои навыки инженера данных, то умение работать с Azure и автоматизировать инфраструктуру с помощью Terraform - ключевые компетенции. Именно поэтому мы создали этот курс «Azure ETL с Terraform».На практическом проекте вы научитесь строить полноценное решение для обработки данных в Azure, объединяя возможности Terraform, Az

-1

Изображение курса Контейнеризация ETL c AWS, TDengine и Grafana

Andreas Kretz

29 мая 2025 г., 23:15

Обработка и анализ данных

Контейнеризация ETL c AWS, TDengine и Grafana

Dockerized ETL With AWS, TDengine & Grafana

Инженерам данных часто нужно быстро настроить простой ETL-скрипт, который просто выполняет свою задачу. В этом проекте вы узнаете, как легко реализовать такой ETL на AWS: подключить живые данные из погодного API и записывать их во временную базу данных TDengine.

Изображение курса Contact Tracing с использованием Elasticsearch

Andreas Kretz

29 мая 2025 г., 22:41

PythonElasticsearch

Contact Tracing с использованием Elasticsearch

Contact Tracing with Elasticsearch

В этом увлекательном инженерном проекте вы научитесь отслеживать перемещения пользователей по их сканированиям с телефона. Цель проекта - использовать Elasticsearch как поисковую систему для анализа набора данных, в котором 100,000 пользователей посещают магазины и делают 1,000,000 сканирований.

Изображение курса Работа с данными временных рядов: хранение и визуализация

Andreas Kretz

29 мая 2025 г., 22:17

Обработка и анализ данных

Работа с данными временных рядов: хранение и визуализация

Storing & Visualizing Time Series Data

Обработка, хранение и визуализация данных временных рядов становится всё более важной задачей. От данных IoT и системных журналов до статистики производственных процессов - объём информации, требующей обработки, постоянно растёт.Системы хранения временных рядов, такие как InfluxDB, и инструменты визуализации, такие как Grafana, позволяют управлять данными и делать их доступными для анализа. В этом курсе вы научитесь строить полноценный пайплайн д

Изображение курса Машинное обучение и контейнеры на AWS

Andreas Kretz

29 мая 2025 г., 21:56

Обработка и анализ данныхМашинное обучение

Машинное обучение и контейнеры на AWS

Machine Learning & Containers on AWS

В этом практическом курсе вы научитесь строить полный пайплайн данных на платформе AWS - от получения данных из Twitter API до анализа, хранения и визуализации.Вы создадите собственный алгоритм машинного обучения и развернёте его на AWS с помощью Lambda. Также вы настроите базу данных Postgres с использованием Amazon RDS. Для визуализации результатов вы разработаете интерактивный дашборд на Streamlit и получите опыт его развертывания в контейнера

Изображение курса Современные хранилища данных и Data Lakes

Andreas Kretz

29 мая 2025 г., 21:40

Обработка и анализ данных

Современные хранилища данных и Data Lakes

Modern Data Warehouses & Data Lakes

В роли инженера данных вы будете регулярно работать с аналитическими платформами, где компании хранят данные в Data Lakes и Data Warehouses для построения визуализаций и создания моделей машинного обучения.Современные хранилища данных, такие как AWS Redshift, Google BigQuery и Snowflake, позволяют загружать данные напрямую из файлов в Data Lake. Эта интеграция делает работу с хранилищами гибкой и удобной для аналитических задач.

Изображение курса Инженерия данных на GCP

Andreas Kretz

29 мая 2025 г., 21:13

Обработка и анализ данных

Инженерия данных на GCP

Data Engineering on GCP

Google Cloud Platform (GCP) - одна из самых популярных облачных платформ в мире, предоставляющая обширный набор инструментов и сервисов для построения, управления и оптимизации пайплайнов данных. GCP позволяет эффективно хранить, обрабатывать, анализировать и визуализировать данные, помогая инженерам данных создавать масштабируемые и высокопроизводительные решения.

Andreas Kretz

Популярное в andreas kretz

Snowflake для инженеров данных

Создание локальной системы RAG на основе LlamaIndex и Ollama

Создание API с помощью FastAPI

Инженерия данных с использованием Databricks

Основы Apache Kafka

Курсы от Andreas Kretz

Создание локальной системы RAG на основе LlamaIndex и Ollama

Скрытый фундамент генеративного ИИ

Семантическая индексация и поиск логов

Azure Data Pipelines с Terraform

Контейнеризация ETL c AWS, TDengine и Grafana

Contact Tracing с использованием Elasticsearch

Работа с данными временных рядов: хранение и визуализация

Машинное обучение и контейнеры на AWS

Современные хранилища данных и Data Lakes

Инженерия данных на GCP