Инженерам данных часто нужно быстро настроить простой ETL-скрипт, который просто выполняет свою задачу. В этом проекте вы узнаете, как легко реализовать такой ETL на AWS: подключить живые данные из погодного API и записывать их во временную базу данных TDengine.
Что вы изучите
Основы временных баз данных
Познакомитесь с основами работы временных баз данных, их архитектурой и случаями применения.
Работа с публичным API погоды
Настроите и исследуете внешний погодный API, напишете Python-скрипт для чтения данных из API.
Docker-ETL на AWS
Упакуете скрипт в Docker-контейнер и развернете его как серверлесс ETL с помощью Amazon Elastic Container Registry (ECR), Lambda и EventBridge.
Настройка TDengine
Познакомитесь с TDengine, настроите экземпляр через облако TDengine и сконфигурируете базу данных.
Визуализация данных в Grafana
Визуализируете данные из API, сохраненные в TDengine, с помощью Grafana. Узнаете, как подключить TDengine к Grafana и создать дашборд для анализа данных.
Посмотреть больше
Это пробный урок. Оформите подписку, чтобы получить доступ ко всем материалам курса. Премиум
Ограничение времени просмотра
Вы можете просматривать пробный урок только 10 минут. Получите полный доступ, чтобы смотреть без ограничений.
Я - старший инженер по данным и тренер, техноэнтузиаст и отец. Уже более десяти лет я увлечён Data Engineering. Сначала я стал инженером по данным самоучкой, а затем возглавил команду инженеров по данным в крупной компании. Когда я понял, насколько велика потребность в обучении в этой сфере, я последовал за своей страстью и основал собственную Академию Data Engineering. С тех пор я помог более чем 2 000 студентам достичь своих целей.
Команда внимательно читает ваши комментарии и оперативно на них реагирует. Вы можете спокойно оставлять запросы на обновления или задавать любые вопросы о курсе здесь.
После прохождения курса вы научитесь работать с архитектурой, основными концепциями Apache Airflow и приобретете практические навыки разработки ETL процессов.
ETL тестирование: От новичка к эксперту - вступной курс для всех тестировщиков програмного обеспечения. В этом курсе вы пройдетесь по таким вещам, как:- Концепты складирования данных Business Intelligence;- Что такое ETL тестирование, жизненный цикл QA и концепты РСУБД;- Углубленное представление о рабочем процессе хранилища данных и сравнение тестирования базы данных с хранилищем данных;- Различные сценарии тестирования ETL, такие как тестирован