Конференция SmartData 2024 прошла 4 сентября онлайн и 8–9 сентября офлайн в Москве. Участники конференции обсуждали СУБД и хранилища данных, дата-платформы, обработку данных, DataOps и облачные решения. В программе было более 40 докладов о трендовых инструментах, миграциях хранилищ данных, open source инструментах и даже использовании данных в космической индустрии. А кроме докладов — несколько часов онлайн и офлайн-дискуссий, конкурсы и экспертные обсуждения от партнеров конференции и афтерпати для участников.
Это пробный урок. Оформите подписку, чтобы получить доступ ко всем материалам курса. Премиум
Ограничение времени просмотра
Вы можете просматривать пробный урок только 10 минут. Получите полный доступ, чтобы смотреть без ограничений.
02 Использование вероятностных структур данных для оптимизации ETL
Урок 3.
00:41:27
03 Шардированныи не значит распределенныи что важно знать когда Pos
Урок 4.
00:46:19
04 Как жить с data swamp
Урок 5.
00:30:30
05 Интервью с Дмитрием Устюговым
Урок 6.
00:53:10
06 Эффективные сервисы ML Inference неиросетеи в Яндекс рекламе
Урок 7.
00:46:10
07 Airbyte 2 года в продакшене [skladchik.org]
Урок 8.
00:49:46
08 Assessing Data Pipeline Quality Sanity with Data Angiograms
Урок 9.
00:30:43
09 Airbyte или NiFi два подхода два инструмента одна цель
Урок 10.
00:51:31
10 Как построить паиплаин RAG с использованием LLamaIndex
Урок 11.
00:37:37
11 Проблемы обработки Excel-фаилов в Apache NiFi и как их решать
Урок 12.
00:43:36
12 От хаипа до продакшена data mesh на Airflow dbt
Урок 13.
00:32:16
13 Альтернативные варианты восприятия информации в будущем программ
Урок 14.
00:20:43
14 Оптимизация распределения партиции в последовательности задач
Урок 15.
00:23:58
15 Debezium Engine практическое руководство по использованию
Урок 16.
00:11:16
16 Подведение итогов онлаин-части конференции SmartData 2024
Урок 17.
00:12:04
01 Открытие офлаин-части конференции SmartData 2024
Урок 18.
00:47:04
02 Пишем свои cluster manager для Apache Spark
Урок 19.
00:52:49
03 Как мы сократили TTM создания дашбордов
Урок 20.
00:47:36
04 Как кролик съел зеленую сливу и не умер сказ о миграции на Iceberg
Урок 21.
00:46:55
05 Как работает Apache Iceberg на примере Trino
Урок 22.
00:46:49
06 Как мы Apache Kafka на Redpanda меняли
Урок 23.
00:37:01
07 Data Vault 2 0 В каких случаях внедрять разбор основных проблем
Урок 24.
00:47:28
08 Инструменты Data Quality как зачем почему Опыт Т-Банка
Урок 25.
00:43:19
09 dbt в деле реальные кеисы и лаифхаки
Урок 26.
00:46:13
10 Data sketches быстро дешево и почти точно
Урок 27.
00:50:00
11 Data mesh ожидания vs реальность
Урок 28.
00:41:40
12 CICD в большом on-premise Datalake-проекте
Урок 29.
00:41:58
13 Как мы делаем облачныи Greenplum
Урок 30.
00:47:34
14 Каждыи баит на вес золота Опыт построения DMP в рекламе Яндекса
Урок 31.
00:46:52
15 Data Lineage как настроить в зоопарке технологии и зачем это нужно
Урок 32.
00:47:10
16 Выбрасываем Java и кратно ускоряем SparkPresto Или пока нет
Урок 33.
00:45:28
17 Как быстро запустить процесс ведения каталога данных в компании
Урок 34.
00:46:22
18 Schema Registry Ultimate Guide
Урок 35.
00:38:01
19 Snowplow утерянное руководство
Урок 36.
00:40:34
01 Apache Arrow быстрее ниже сложнее
Урок 37.
00:37:31
02 Как мы тестировали 5 способов загрузки данных в Greenplum
Урок 38.
00:44:10
03 NiFi Пишем код для codeless-системы
Урок 39.
00:46:22
04 Как мы строим систему распределенного треисинга в которои можно
Урок 40.
00:43:19
05 One More Way to Make Backup in Ignite
Урок 41.
00:49:07
06 От ручного труда к автоматическои генерации проверок качества данных
Урок 42.
00:46:22
07 CICD для большого хранилища данных
Урок 43.
00:43:37
08 Рецепт платформы потоковои обработки данных на Apache Flink
Урок 44.
00:46:37
09 Обработка событии в Snowplow от сбора до аналитики
Урок 45.
00:39:22
10 CDC от источника до хранилища как в банке Синара построили CDC
Урок 46.
00:45:58
11 Как навести порядок в двух эксабаитах данных
Урок 47.
00:39:34
12 Автогенерация синтетических данных с использованием алгоритмов ML
Урок 48.
00:45:46
13 Оптимизации сериализатора ВКонтакте
Урок 49.
00:40:28
14 Оркестратор паиплаинов для небольшои команды инженеров и аналити
Урок 50.
00:37:05
15 The State of Data RU Edition
Урок 51.
00:45:57
16 Storage для lake
Урок 52.
00:43:09
17 Это реальныи космос space-индустрия сегодня
Урок 53.
00:09:58
18 Закрытие конференции SmartData 2024
Автор - JUG Ru Group
JUG Ru Group
JUG Ru Group — хардкорные встречи и конференции для IT-специалистов. Мероприятия для опытных специалистов. Сложные, технические, специализированные. Тщательно отбирают спикеров, которые помогут сориентироваться в индустрии: трендах, инструментах, подходах
Привет, второй доклад не полный (15 минут похоже не хватает)
Можно перезалить?
Alphonse
@Andrew these videos are super cool, audio transcript in english would be great addition.
CourseHunter Team
Alphonse
you can use Google Chromes built in functionality to do so
Команда внимательно читает ваши комментарии и оперативно на них реагирует. Вы можете спокойно оставлять запросы на обновления или задавать любые вопросы о курсе здесь.
SmartData 2023 - конференция по инженерии данных. Технические доклады о хранилищах данных, стриминге, data governance, архитектуре DWH и другом, применимые в работе дата-инженера.
SmartData 2021 - конференция для Data-инженеров. 4 дня. Спикеры со всего мира. Несколько десятков технических докладов о хранилищах данных, стриминге, data governance и многом другом.
Курс «Data-инженер» подойдёт аналитикам данных, разработчикам и администраторам баз данных. Он охватывает темы, такие как создание дата-пайплайнов, работа с базами данных (SQL, NoSQL), оптимизация данных, использование инструментов (Python, AirFlow, Hadoop, Kafka) и многое другое. Практические задания, работа в группах и консультации экспертов помогут студентам освоить профессию Data-инженера.
SmartData - это единственная в России конференция, посвященная инженерии данных. Свои выступления докладчики на конференции наполняют технической конкретикой по различным темам — начиная от отказоустойчивости и заканчивая MLOps и BI. В этом году спикеры также поделятся информацией о внутренней архитектуре баз данных.
Можно перезалить?