Этот материал находится в платной подписке. Оформи премиум подписку и смотри или слушай Data Engineering, а также все другие курсы, прямо сейчас!
Премиум
  • Урок 1. 00:06:08
    1. Профессии в Data Science
  • Урок 2. 00:02:33
    2. Обзор курса
  • Урок 3. 00:02:45
    3. Особенности курса
  • Урок 4. 00:04:39
    4. Практический Linux
  • Урок 5. 00:02:46
    5. Пользователи в Linux
  • Урок 6. 00:03:05
    6. Файлы, директории и права доступа
  • Урок 7. 00:08:29
    7. Работа с файлами
  • Урок 8. 00:03:20
    8. Процессы и ресурсы Linux-серверов
  • Урок 9. 00:13:54
    9. Эффективная работа в командной строке ч.1
  • Урок 10. 00:07:11
    9.1. Эффективная работа в командной строке ч.2
  • Урок 11. 00:05:57
    10. Введение в bash скрипты
  • Урок 12. 00:07:50
    11. Основы редактора vi
  • Урок 13. 00:07:30
    1.1. Хранилища данных
  • Урок 14. 00:05:44
    1.2. Business Intelligence и OLAP
  • Урок 15. 00:04:38
    1.3. Звезда, снежинка и все-все-все
  • Урок 16. 00:04:21
    1.4. Data Vault
  • Урок 17. 00:05:36
    1.5. Эти буквы E, T и L
  • Урок 18. 00:06:07
    1.6. Параллельная обработка
  • Урок 19. 00:07:47
    1.7. DBMS - системы управления данными
  • Урок 20. 00:09:00
    1.8. Очереди, буферы и другие
  • Урок 21. 00:00:19
    1.9. О чём этот модуль
  • Урок 22. 00:03:02
    2.1. Что такое Hadoop
  • Урок 23. 00:08:35
    2.2. Знакомство с HDFS
  • Урок 24. 00:04:10
    2.3. Знакомство с YARN
  • Урок 25. 00:04:52
    2.4. Знакомство с Map Reduce
  • Урок 26. 00:13:38
    2.5. Знакомство с Arenadata Hadoop
  • Урок 27. 00:07:06
    2.6. Знакомство с Hive
  • Урок 28. 00:03:16
    2.7. Знакомство с Apache Spark
  • Урок 29. 00:09:44
    2.8. Знакомство с Apache Zeppelin
  • Урок 30. 00:00:19
    2.9. О чём этот модуль
  • Урок 31. 00:06:27
    3.1. Источники данных
  • Урок 32. 00:02:43
    3.2.1. Работа с источниками структурированных данных
  • Урок 33. 00:10:10
    3.2.2. Практика. Работа с источниками структурированных данных
  • Урок 34. 00:04:06
    3.2.3. Особенности процесса работы с источниками структурированных данных
  • Урок 35. 00:01:55
    3.3.1. Работа со структурированными файлами
  • Урок 36. 00:10:46
    3.3.2. Практика. Работа со структурированными файлами
  • Урок 37. 00:06:58
    3.3.3. Особенности процесса работы со структурированными файлами
  • Урок 38. 00:08:34
    3.4. Работа с небольшими неструктурированными файлами
  • Урок 39. 00:09:07
    3.4.1. Введение в Kafka, NiFi и HBase
  • Урок 40. 00:04:58
    3.5. Apache Spark и идеальный мир
  • Урок 41. 00:12:41
    3.6. Загрузка XML-файлов
  • Урок 42. 00:03:58
    3.7. Загрузка JSON-файлов
  • Урок 43. 00:04:59
    3.8. Автоматизация процесса загрузки
  • Урок 44. 00:10:32
    3.8.1. Автоматизация процесса загрузки таблиц - Модуль 3
  • Урок 45. 00:15:18
    3.8.2. Автоматизация процесса загрузки таблиц
  • Урок 46. 00:00:30
    3.9. О чём этот модуль
  • Урок 47. 00:06:43
    4.1.1. Введение в Spark- pyspark, приложения, режимы, абстракции
  • Урок 48. 00:05:59
    4.1.2. Введение в Spark- dataframe, методы, движение данных
  • Урок 49. 00:19:47
    4.2. Установка и настройка Spark
  • Урок 50. 00:11:47
    4.3.1. Ввод и вывод в Spark- работа с файлами
  • Урок 51. 00:07:30
    4.3.2. Ввод и вывод в Spark- работа с базами данных
  • Урок 52. 00:05:40
    4.4. Базовые трансформации в Spark
  • Урок 53. 00:06:08
    4.5. Объединение dataframe
  • Урок 54. 00:02:23
    4.6. Агрегаты и оконные функции, сортировка
  • Урок 55. 00:05:17
    4.7. Spark SQL - Модуль 4. Apache Spark и обработка данных
  • Урок 56. 00:09:00
    4.8. RDD- Resilient Distributed Dataset
  • Урок 57. 00:00:31
    4.9. О чём этот модуль - Модуль 4. Apache Spark и обработка данных
  • Урок 58. 00:03:35
    5.1. Файловые системы Hadoop
  • Урок 59. 00:04:20
    5.2. Системы управления базами данных Hadoop
  • Урок 60. 00:04:12
    5.3. Погружение в Hive
  • Урок 61. 00:12:12
    5.4. Метаданные в Hive
  • Урок 62. 00:05:49
    5.5. Форматы файлов Hadoop ч.1
  • Урок 63. 00:05:25
    5.6. Форматы файлов Hadoop ч.2
  • Урок 64. 00:10:45
    5.7. Практическое знакомство с форматами файлов
  • Урок 65. 00:03:06
    5.8. Партиции в Hive
  • Урок 66. 00:18:30
    5.9. Partitions & Buckets- практическая часть
  • Урок 67. 00:05:08
    5.10. Транзакции
  • Урок 68. 00:10:19
    5.11. Транзакции в Hive
  • Урок 69. 00:08:06
    5.12. Каталогизация данных
  • Урок 70. 00:06:11
    5.13. Обзор Apache Atlas
  • Урок 71. 00:05:16
    5.14. Управление доступом к данным
  • Урок 72. 00:01:13
    5.15. О чём этот модуль
  • Урок 73. 00:04:42
    6.1. Введение
  • Урок 74. 00:06:33
    6.2. Установка и настройка Airflow
  • Урок 75. 00:07:43
    6.3. Основные сущности Airflow
  • Урок 76. 00:09:58
    6.4. Создадим наш первый DAG
  • Урок 77. 00:10:37
    6.5. Решение типовых проблем
  • Урок 78. 00:05:15
    6.6. Решение типовых проблем. Лог файлы
  • Урок 79. 00:04:32
    6.7. Subdags & branches
  • Урок 80. 00:14:42
    6.8. Airflow Subdags
  • Урок 81. 00:05:18
    6.9. Взаимодействие со Spark
  • Урок 82. 00:05:29
    6.10. Пример. Взаимодействие со Spark
  • Урок 83. 00:04:17
    6.11. Знакомство с Apache Livy
  • Урок 84. 00:00:29
    6.12. О чём этот модуль
  • Урок 85. 00:05:50
    7.1. Обзор облачных хранилищ
  • Урок 86. 00:06:55
    7.2. Amazon Web Services ч.1
  • Урок 87. 00:04:03
    7.3. Amazon Web Services ч.2
  • Урок 88. 00:04:08
    7.4. Microsoft Azure
  • Урок 89. 00:05:08
    7.5. Google Cloud Platform
  • Урок 90. 00:02:43
    7.6 Yandex Cloud