Курс предназначен для программистов, имеющих или не имеющих опыт в сфере Big Data и машинного обучения.
Содержание курса:
- Установка Hadoop и Apache Spark на Linux или Windows;
- Принципы работы с параллельными вычислениями, адаптация алгоритмов;
- Выбор модели машинного обучения;
- Реализация проекта с использованием потоковой обработки данных (streaming);
- Устранение часто встречающихся ошибок.
Включает демонстрации и задания, позволяющие быстро реализовать полученные знания и навыки на практике.