Главная страницаКатегория awsИнженерия данных на AWS

Инженерия данных на AWS

Name: Инженерия данных на AWS
Price: 13 USD
Rating: 5 (2 reviews)

Data Engineering on AWS

Andreas Kretz

★5 (всего оценок - 2)

Продолжительность

4 ч 46 мин

Категория

AWS

Количество уроков

58 Видео

Дата добавления

29 мая 2025 г., 20:35

Язык

Английский

Дата обновления

29 апр. 2026 г., 23:20

Инженерия данных на AWS — это практико-ориентированный курс, который помогает новичкам в сфере Data Engineering освоить ключевые облачные инструменты и научиться строить полноценные дата‑платформы на базе Amazon Web Services. Материал курса разработан так, чтобы вы смогли уверенно применять полученные знания в реальных проектах и подготовиться к работе инженером данных.

Что дает этот курс

Вы шаг за шагом создадите end‑to‑end инфраструктуру для обработки данных интернет‑магазина: от сбора и потоковой передачи до хранения, трансформации и визуализации. Обучение построено на реальных задачах, благодаря чему вы освоите ключевые сервисы AWS и типичные паттерны построения дата‑пайплайнов.

Практика с реальными данными

Работая с данными интернет‑магазина, вы изучите их структуру, определите цели аналитики и сформируете требования к своим будущим пайплайнам.

Основные разделы курса

Работа с данными

Разбор типов данных и их особенностей.
Понимание бизнес‑целей проекта и определение требований к архитектуре.

Проектирование платформы и пайплайнов

Вы научитесь проектировать архитектуру потоковой и пакетной обработки данных, создадите собственный Data Lake и Data Warehouse.

Пайплайны загрузки данных в S3 (Data Lake).
Обработка данных в DynamoDB (NoSQL) и Redshift (DWH).
Создание API и настройка потоковой передачи данных.

Основы AWS для инженера данных

Создание AWS‑аккаунта и базовая настройка безопасности.
Работа с IAM: роли, политики, права доступа.
Использование CloudWatch для мониторинга.
Автоматизация с помощью Boto3 и Python.

Пайплайн загрузки данных (Data Ingestion)

Научитесь строить надежные ingestion‑пайплайны, используя серверлесс‑архитектуру AWS.

Создание API через API Gateway.
Потоковая передача данных в Kinesis.
Настройка IAM и разработка ingestion‑логики на Python.

Передача данных в S3 (Data Lake)

Вы создадите Lambda‑функцию, которая принимает данные из Kinesis и загружает их в S3, формируя надежное хранилище в формате Data Lake.

Передача данных в DynamoDB

Вы построите быстрый и отказоустойчивый NoSQL‑пайплайн:

чтение данных из Kinesis,
загрузка в DynamoDB,
оптимизация схемы хранения.

Создание API для доступа к данным

Вы разберете, как правильно предоставлять доступ к данным через API и почему подключение BI‑систем напрямую к базе данных — рискованная практика.

Визуализация данных в Redshift

Передача потоковых данных в Redshift через Kinesis Firehose.
Создание и настройка Redshift‑кластера.
Настройка безопасности и создание таблиц.
Подключение Power BI для анализа данных.

Batch‑обработка: AWS Glue, S3 и Redshift

Вы освоите инструменты для пакетной обработки больших объемов данных:

настройка и запуск AWS Glue,
работа с Crawler и Data Catalog,
запись данных из S3 в Redshift,
отладка ETL‑процессов.

Почему этот курс полезен

По завершении обучения вы получите практический опыт работы с ключевыми сервисами AWS, а также навыки построения потоковых и пакетных пайплайнов — то, что требуется инженерам данных в современных компаниях. Программа курса поможет вам уверенно пройти интервью и начать карьеру в области Data Engineering.

Это пробный урок. Оформите подписку, чтобы получить доступ ко всем материалам курса. Премиум

Урок 1. 00:00:31
Important: Before you start!
Урок 2. 00:02:22
Introduction
Урок 3. 00:04:16
Data Engineering
Урок 4. 00:05:21
Data Science Platform
Урок 5. 00:03:04
Data Types You Encounter
Урок 6. 00:02:55
What Is A Good Dataset
Урок 7. 00:03:17
The Dataset We Use
Урок 8. 00:06:28
Defining The Purpose
Урок 9. 00:03:47
Relational Storage Possibilities
Урок 10. 00:06:29
NoSQL Storage Possibilities
Урок 11. 00:03:50
Selecting The Tools
Урок 12. 00:03:06
Client
Урок 13. 00:01:19
Connect
Урок 14. 00:01:30
Buffer
Урок 15. 00:02:43
Process
Урок 16. 00:03:42
Store
Урок 17. 00:03:02
Visualize
Урок 18. 00:03:01
Data Ingestion Pipeline
Урок 19. 00:02:20
Stream To Raw Storage Pipeline
Урок 20. 00:03:10
Stream To DynamoDB Pipeline
Урок 21. 00:02:57
Visualization API Pipeline
Урок 22. 00:05:30
Visualization Redshift Data Warehouse Pipeline
Урок 23. 00:03:20
Batch Processing Pipeline
Урок 24. 00:01:59
Create An AWS Account
Урок 25. 00:02:46
Things To Keep In Mind
Урок 26. 00:04:08
IAM Identity & Access Management
Урок 27. 00:02:23
Logging
Урок 28. 00:02:58
AWS Python API Boto3
Урок 29. 00:04:03
Development Environment
Урок 30. 00:02:34
Create Lambda for API
Урок 31. 00:08:31
Create API Gateway
Урок 32. 00:01:39
Setup Kinesis
Урок 33. 00:05:01
Setup IAM for API
Урок 34. 00:06:10
Create Ingestion Pipeline (Code)
Урок 35. 00:05:47
Create Script to Send Data
Урок 36. 00:04:54
Test The Pipeline
Урок 37. 00:03:43
Setup S3 Bucket
Урок 38. 00:03:22
Configure IAM For S3
Урок 39. 00:07:17
Create Lambda For S3 Insert
Урок 40. 00:04:02
Test The Pipeline
Урок 41. 00:09:01
Setup DynamoDB
Урок 42. 00:03:37
Setup IAM For DynamoDB Stream
Урок 43. 00:09:21
Create DynamoDB Lambda
Урок 44. 00:06:11
Create API & Lambda For Access
Урок 45. 00:04:48
Test The API
Урок 46. 00:08:09
Setup Redshift Data Warehouse
Урок 47. 00:03:13
Security Group For Firehose
Урок 48. 00:05:52
Create Redshift Tables
Урок 49. 00:03:03
S3 Bucket & jsonpaths.json
Урок 50. 00:07:59
Configure Firehose
Урок 51. 00:07:44
Debug Redshift Streaming
Урок 52. 00:05:59
Bug-fixing
Урок 53. 00:12:17
Power Bi
Урок 54. 00:05:15
AWS Glue Basics
Урок 55. 00:13:10
Glue Crawlers
Урок 56. 00:13:44
Glue Jobs
Урок 57. 00:07:17
Redshift Insert & Debugging
Урок 58. 00:10:41
What We Achieved & Improvements

Автор - Andreas Kretz

Andreas Kretz

Я - старший инженер по данным и тренер, техноэнтузиаст и отец. Уже более десяти лет я увлечён Data Engineering. Сначала я стал инженером по данным самоучкой, а затем возглавил команду инженеров по данным в крупной компании. Когда я понял, насколько велика потребность в обучении в этой сфере, я последовал за своей страстью и основал собственную Академию Data Engineering. С тех пор я помог более чем 2 000 студентам достичь своих целей.

+26

Комментарии