[OTUS] Промышленный Machine Learning на больших данных. Часть 2 из 4 (2020)

Itnull · 24.12.20

Автор: OTUS
Название: Промышленный Machine Learning на больших данных. Часть 2 из 4 (2020)

Описание:

Что даст вам этот курс

Курс рассчитан на Data Engineer-ов или специалистов в машинном обучении.

Вы научитесь:

использовать стандартные инструменты ML-конвейеров в распределенной среде;
разрабатывать собственные блоки для ML-конвейеров;
адаптировать ML-алгоритмы к распределенной среде и инструментам big data;
использовать Spark, SparkML, Spar Streaming;
организовывать промышленные конвейеры сбора данных;
разрабатывать алгоритмы потоковой подготовки данных для машинного обучения;
обеспечивать контроль качества на всех этапах движения ML-решений в промышленную эксплуатацию.

Необходимые знания
Базовые навыки программирования:

управляющие конструкции, циклы, рекурсия;
основные структуры данных: массивы, списки, словари, деревья;
базовые принципы ООП;
знакомство с одним из языков: Python, Java, Scala, C++.
Математика:
линейная алгебра: вектора, матрицы и их произведения;
матан: производная простых и композитных функций;
вычметоды: градиентный спуск, Ньютоновские итерации;
теория вероятности: случайные события и величины, математическое ожидание, дисперсия.

Технологии:

понимание основ работы вычислительной техники в рамках архитектуры фон Неймана (процессор, память, кэш, подключаемое хранилище);
понимание общих принципов реляционных СУБД, знание SQL.

Будет плюсом: знакомство с классическими алгоритмами машинного обучения.

Программа:

Базовые вводные для старта курса

Технологические основы распределенной обработки данных

Основы распределенного МL

Потоковая обработка данных

Целеполагание и анализ результатов

Вывод результатов ML в продакшн

Тема 21. Подходы к выводу ML-решений в продакшн
Тема 22. Версионирование, воспроизводимость и мониторинг
Тема 23. Онлайн-сервинг моделей
Тема 24. Паттерны асинхронного потокового ML и ETL
Тема 25. Если надо Python
Тема 26. Альтернативные фреймворки с поддержкой Python и область применимости Dusk, KubeFlow, Seldon Core, H2O. Особенности эксплуатации гетерогенных систем в проме

ML на python в продакшне

Продвинутые топики

Скачать

Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.