Главная страницаКатегория обработка и анализ данныхМашинное обучение и контейнеры на AWS

Машинное обучение и контейнеры на AWS

Name: Машинное обучение и контейнеры на AWS
Price: 13 USD

Machine Learning & Containers on AWS

Andreas Kretz

Начать Сейчас

Продолжительность

1 ч 33 мин

Категория

Обработка и анализ данных

Количество уроков

25 Видео

Дата добавления

29 мая 2025 г., 21:56

Язык

Английский

В этом практическом курсе вы научитесь строить полный пайплайн данных на платформе AWS - от получения данных из Twitter API до анализа, хранения и визуализации.

Вы создадите собственный алгоритм машинного обучения и развернёте его на AWS с помощью Lambda. Также вы настроите базу данных Postgres с использованием Amazon RDS. Для визуализации результатов вы разработаете интерактивный дашборд на Streamlit и получите опыт его развертывания в контейнерах с помощью Elastic Container Registry (ECR) и Elastic Container Service (ECS). Кроме того, в курсе вы познакомитесь с инструментом Poetry и научитесь управлять зависимостями вашего проекта.

Структура курса

Twitter API

Twitter API - отличное место для получения открытых данных. Вы научитесь настраивать доступ к API, получать твиты из ленты пользователя для дальнейшей обработки. Разберёмся в настройке API и формате данных (payload), которые он возвращает.

База данных RDS

Каждой платформе нужно хранилище данных. Вы научитесь настраивать базу данных Postgres в Amazon RDS и разберётесь, зачем мы будем сохранять JSON-твиты в эту базу. Также вы освоите работу с виртуальными облачными сетями (VPC), чтобы сделать базу доступной из интернета. С помощью PGAdmin вы создадите таблицы и выполните запросы к базе данных.

NLP Lambda

Для анализа текста мы применим готовый алгоритм машинного обучения из библиотеки Natural Language Toolkit (NLTK). Вы создадите Lambda-функцию, которая будет получать твиты из API, определять их тональность (sentiment) и сохранять результаты в базу данных.

Чтобы запустить функцию Lambda, вы научитесь подключать необходимые зависимости через слои (layers) - как импортировать подготовленные K-Layers, так и создать свой собственный layer. Также вы узнаете, как настроить автоматический запуск Lambda-функции с помощью Event Bridge.

Управление зависимостями и приложение Streamlit

Для визуализации результатов вы создадите приложение на Streamlit. Вы настроите локальную среду разработки с Anaconda3 и создадите виртуальное окружение conda. С помощью предоставленного Git-репозитория вы научитесь управлять зависимостями проекта с помощью Poetry. Мы пошагово разберём код приложения и покажем, как запускать его в новом виртуальном окружении для тестирования.

Развёртывание приложения Streamlit в ECS

Когда визуализация готова, вы изучите, как работать с Docker-образами и контейнерами в AWS. Вы создадите Elastic Container Registry (ECR) и установите AWS CLI. Научитесь создавать группы пользователей и отдельных пользователей с ограниченными правами доступа в IAM.

После сборки Docker-образа вы загрузите его в ECR, настроите кластер ECS Fargate и развернёте ваше приложение Streamlit в виде задачи (task) на платформе.

Посмотреть больше

Это пробный урок. Оформите подписку, чтобы получить доступ ко всем материалам курса. Премиум

Урок 1. 00:02:39
Introduction video
Урок 2. 00:02:07
Project architecture explained
Урок 3. 00:01:27
Relational DB
Урок 4. 00:02:38
RDS setup
Урок 5. 00:02:13
Setting VPC inbound rules for internet access
Урок 6. 00:04:06
PG Admin installation & S3 config
Урок 7. 00:03:12
Lambda intro & IAM setup
Урок 8. 00:01:25
Create Lambda function
Урок 9. 00:08:23
The Lambda function code explained
Урок 10. 00:00:57
Insert the code into your Lambda function
Урок 11. 00:05:33
Add layers to Lambda from Klayers
Урок 12. 00:04:41
Create & configure custom layers for twython & psycopg2
Урок 13. 00:04:54
Test Lambda & set environment variables
Урок 14. 00:03:16
Schedule your Lambda with Event Bridge
Урок 15. 00:04:08
Setup virtual conda environment
Урок 16. 00:05:58
Poetry dependency installs & run Streamlit UI locally
Урок 17. 00:07:53
Streamlit app code explained
Урок 18. 00:01:53
Setup container registry ECR
Урок 19. 00:05:20
AWS CLI install and ECR login
Урок 20. 00:02:53
Dockerfile explained, Docker image build & push image to ECR
Урок 21. 00:01:35
Create ECS Fargate cluster
Урок 22. 00:05:00
ECS task IAM configuration & Streamlit task creation
Урок 23. 00:05:15
Fixing the ECS task
Урок 24. 00:01:00
Stopping the task on ECS after you are finished
Урок 25. 00:05:08
Conclusion & outlook

Link to the GitHub of this project: https://github.com/team-data-science/ML-on-AWS-1

Автор - Andreas Kretz

Andreas Kretz

Я - старший инженер по данным и тренер, техноэнтузиаст и отец. Уже более десяти лет я увлечён Data Engineering. Сначала я стал инженером по данным самоучкой, а затем возглавил команду инженеров по данным в крупной компании. Когда я понял, насколько велика потребность в обучении в этой сфере, я последовал за своей страстью и основал собственную Академию Data Engineering. С тех пор я помог более чем 2 000 студентам достичь своих целей.

+25

Комментарии