Apache Spark Training
Огляд послуги
Послуга призначена для отримання знань і практичних навичок в області Spark
Цілі послуги
В результаті надання даної послуги, слухачі повинні будуть:
- Мати уявлення про Apache Spark:
- Порівняння з класичним MapReduce
- Архітектура
- Варіанти розгортання і запуску
- Основи Аналітики Apache Spark
- Оптимізація продуктивності в Spark
- Мати уявлення про середовище Apache Zeppelin
- Відрізняти версії в різних дистрибутивах
- Мати уявлення про RDD
- Ознайомлення з перевагами Lazy Evaluation
- Мати уявлення про Spark SQL
- Використання різних джерел даних до Spark SQL
- Розподілена обробка з DataFrame
- Відрізняти DataFrame від RDD
- Ознайомлення з основними операціями з DataFrame
- Мати уявлення про Spark Streaming
- Обробка потокових Даних за допомогою DStreams
- Застосування трансформацій і дій до DStreams
- Віконні функції в Spark Streaming
Проведуть ряд практичних робіт:
- "Запуск Spark завдання за допомогою Spark shell"
- "Запуск Spark завдання за допомогою Apache Zeppelin і візуалізація результатів"
- "Запуск основних трансформацій і дій за допомогою Apache Zeppelin"
- "Рішення завдання аналізу чеків з використанням RDD в Spark"
- "Запуск основних операцій Spark SQL"
- "Рішення завдання аналізу чеків з використанням SparkSQL"
- "Рішення завдання аналізу потокових даних з використанням Spark Streaming"
Вимоги до рівня підготовки: Мінімальні навички SQL, бажані початкові знання мови Java, а також досвід роботи в ОС Linux на рівні досвідченого користувача
Запис на курс
Код курсу | TD APAST |
---|---|
Тривалість | 2д (16ч) |
Код екзамену | |
Вартість без ПДВ | 36 700 грн. |