9 проектов
для портфолио
Авторы курса
эксперты из Сбера, Visa, Wildberries, Luxoft, PropellerAds
Доступ к курсу
навсегда
Дата-инженер — специалист, который работает с большими данными (big data). Он организует сбор, очистку и загрузку данных в базы, создаёт инфраструктуру для хранения, чтобы дата-аналитики могли найти в них полезные инсайты для бизнеса.
Кому подойдёт этот курс
Новичкам
С нуля освоите Python и SQL. Научитесь собирать, анализировать и обрабатывать данные. Решите задачи на основе реальных кейсов и добавите их в портфолио. Сможете начать карьеру в Data Engineering во время обучения.
Начинающим аналитикам
Изучите все этапы работы с данными. Научитесь собирать информацию из разных источников, выстраивать архитектуру для её хранения и визуализировать отчёты. Сможете самостоятельно подготовить данные для последующего анализа.
Программистам
Подтянете знание SQL для работы с базами данных. Пройдёте весь путь дата-инженера от сбора сырых данных до деплоя модели. Опыт в программировании поможет быстро разобраться в новой профессии и сменить сферу.
Чему вы научитесь
Использовать инструменты анализа
Освоите языки Python и SQL. Сможете работать с библиотеками и фреймворками pandas, airflow, spark.
Тестировать код
Поймёте, как проводить регрессионное тестирование. Сможете тестировать пакеты, пайплайны и обрабатывать ошибки.
Разворачивать Data Science проект
Поймёте, как реализовывать загрузку данных и собирать информацию из разных источников. Сможете выстраивать готовый пайплайн проекта.
Обрабатывать данные
Узнаете, как подключаться к источникам информации и загружать их в систему. Сможете очищать, сохранять и интегрировать данные.
Взаимодействовать с заказчиком
Разберётесь, как готовить отчётность и согласовывать инфраструктуру данных. Сможете предоставить корректные данные заказчику.
Работать в команде
Познакомитесь с git и облачными сервисами для совместной работы. Сможете эффективно взаимодействовать со всеми участниками процесса.
Содержание курса
Среднее время прохождения — 5 месяцев.
Введение в Data Science
Пройдёте все этапы работы с данными. Научитесь выявлять проблемы, собирать бизнес-требования. Будете выгружать данные из различных источников, проводить разведочный анализ и готовить датасет к дальнейшему использованию. Обучите и внедрите готовую ML-модель, попробуете себя в роли продуктового и маркетингового аналитика. Узнаете, как формулировать и проверять гипотезы. Создадите первый проект на основе реальных данных совместно с VK и сервисом «СберАвтоподписка».
Среднее время прохождения — 4 месяца. В процессе вам предстоит решить 6 реальных кейсов из практики дата-инженера и выполнить итоговый проект.
Data Engineer Junior
Разбираемся в типах источников данных.
Работаем с потоковыми источниками и API: загружаем данные из внешних сервисов.
Подключаем источники с помощью Data Ingestion Tool.
Кейс: напишете приложение, которое загружает данные в базу, или построите процесс обработки данных с помощью NiFi.
Используем Docker для автоматизации.
Подключаем мониторинг для контроля за сервисами.
Настраиваем логирование для анализа работы сервисов.
Кейс: развернёте приложение для загрузки данных в продовом окружении. Упакуете его в Docker, подключите сервисы мониторинга и логирования для контроля его работы.
Разбираемся с Hadoop для масштабирования вычислений.
Используем Spark для обработки данных.
Учимся обрабатывать сложные данные в Spark.
Используем Hive для анализа слабоструктурированных данных.
Кейс: подготовить датасет клиентских запросов компании, чтобы найти причины сбоя сервиса.
Разбираемся в хранилищах данных для аналитики.
Строим хранилище по архитектуре Data Lake.
Управляем ETL-процессами с помощью Airflow.
Знакомимся с ClickHouse.
Кейс: подготовить Data Lake на основе данных IoT для анализа энергопотребления арендаторов жилья.
Моделируем DWH.
Работаем с аналитическими базами данных.
Строим DWH.
Создаём витрины данных.
Кейс: подготовить DWH для анализа успеваемости студентов на онлайн-курсах.
Тестируем Python-приложения на примере DAG Airflow.
Ищем проблемы в данных и учимся их устранять.
Создаём процедуры для контроля качества данных.
Кейс: создать пайплайн обработки данных биллинга с проверкой качества данных и бизнес-правил для телеком-компании.
Карьерный консультант поможет подготовиться к собеседованию в компании-партнёре. Разберёте частые вопросы и научитесь меньше переживать на интервью.
Напишете сопроводительное письмо и грамотно оформите резюме.
Будете готовы пройти собеседование — карьерный консультант организует встречу с работодателем.
На интервью презентуете проекты, над которыми вы работали на курсе, а знания и навыки пригодятся для выполнения тестовых задач.
Среднее время прохождения — 3 месяца
Data Engineer advanced
Научитесь пользоваться типовыми средствами мониторинга, настраивать алерты. Будете выбирать архитектуру для хранения данных и работать со сложными типами архитектуры хранилищ. Выстраивать инфраструктуру и пайплайны для обучения ML-моделей.
Основы математики для Data Science
Получите базовые знания по математике для работы с машинным обучением. Поймёте, что такое аппроксимация, интерполяция, функции, регрессии, матрицы и векторы. Научитесь работать с математическими сущностями в Python-библиотеке SymPy.
Основы статистики и теории вероятностей
Поймёте принципы работы со случайными величинами и событиями. Познакомитесь с некоторыми видами распределений и статистическими тестами, которые пригодятся при составлении моделей и проверке гипотез.
Основы статистики и теории вероятностей. Advanced
Узнаете подробнее о случайных величинах, зависимостях и процессах. Научитесь использовать Python для проверки закономерностей, применять функции генерации основных распределений. Протестируете гипотезы и поставите задачи А/В-тестирования.
Карьера разработчика: трудоустройство и развитие
Узнаете, как выбрать подходящую вакансию, подготовиться к собеседованию и вести переговоры с работодателем. Сможете быстрее получить должность, которая соответствует вашим ожиданиям и умениям.
Система контроля версий Git
Научитесь версионировать изменения в коде, создавать и управлять репозиториями, ветками, разрешать конфликты версий. Узнаете полезные правила работы с Git.
Английский для IT-специалистов
Получите языковые навыки, которые помогут пройти собеседование в иностранную компанию и комфортно общаться в смешанных командах.
Будьте первым кто оставит отзыв.
Оставить отзыв можно только с предоставлением сертификата о прохождении курса.
Популярные курсы
-
Онлайн-курс для подростков «Стресс...3 900 ₽От Детская бизнес-школа ITC Group
-
MBA: Менеджмент в медицине, програ...350 000 ₽От Emas
-
MBA: Стратегический менеджмент, ди...315 000 ₽От Emas
-
Executive MBA ǀ 1 год385 000 ₽От Emas
-
Executive MBA: Стратегический мене...385 000 ₽От Emas
-
DBA: Стратегический менеджмент, ди...505 000 ₽От Emas