Data Scientist: с нуля до middle

43 студента зачислены

Длительность обучения

20 месяцев

Трудоустройство

Поможем найти работу или стажировку

Документ

Диплом о профессиональной переподготовке

Data Scientist структурирует большие данные

Специалист создаёт и обучает предиктивные модели с помощью алгоритмов машинного обучения и нейросетей — помогает бизнесу находить скрытые закономерности, прогнозировать развитие событий и оптимизировать ключевые бизнес-процессы.

Кому подойдёт этот курс

Новичкам в Data Science

С нуля овладеете знаниями и навыками, необходимыми для работы в перспективной сфере

Аналитикам

Углубитесь в Data Science, систематизируете знания и повысите свою ценность на рынке труда

Разработчикам

Расширите компетенции и получите базу для перехода из программирования в анализ больших данных

Чему вы научитесь

Работать с SQL

Писать запросы, работать с данными в базе без переноса в таблицы, загружать данные и сохранять историю, работать с разными форматами файлов

Проверять данные и определять проблемы

Обрабатывать текстовые данные, чтобы передавать их в алгоритмы машинного обучения, генерировать новые значимые признаки

Применять математику в алгоритмах

Освоите необходимый математический аппарат для продуктивной работы с моделями данных, машинным обучением и нейронными сетями

Использовать Python и библиотеки

Автоматизировать работу с большими массивами, получать данные из внешних источников, обосновывать выводы, полученные при анализе данных

Обучать многослойные нейронные сети и строить модели машинного обучения

Проверять гипотезы, строить рекомендательную систему и нейронную сеть, выявлять скрытые аномалии в данных

Лидировать Data-проекты, работать в команде и находить общий язык с заказчиком

Структурировать результаты, формулировать гипотезы, выявлять потребности, находить области применения машинного обучения

Содержание курса

1 ступень. Погружение

Научитесь думать как аналитик и формулировать гипотезы для проверки. Поймёте, что аналитика строится вокруг данных. Познакомитесь с базовым инструментом аналитика и сможете проводить в нём простой анализ данных.

 

Познакомитесь со статистическими показателями, научитесь проводить статистический анализ данных и проверять гипотезы с помощью различных инструментов.

Поймёте, как создавать наглядные визуализации, откуда берутся данные для визуализации и как с ними работать. Узнаете, как создавать истории с помощью данных.

2 ступень. SQL, Python и Big Data

В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.

Узнаете, как собрать и управлять командой Big Data-проекта. Освоите подход CRISP-DM, определите компетенции и состав команды. Определите, сколько данных вам нужно для нахождения инсайтов. Найдёте задачи под Big Data в своей компании. Поймёте, как и по каким правилам хранить данные. Сможете обосновывать влияние на сбор данных, мониторинг и отчётность.

Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.

Изучите основные операции с векторами, матричными операциями. Рассмотрите генетические алгоритмы, алгоритм дифференциальной эволюции. Узнаете, что такое математическое ожидание, дисперсия и моменты старших порядков. Изучите закон больших чисел.

3 ступень. Машинное обучение, Deep Learning и нейронные сети

Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации.

В этом и следующих блоках вы будете применять полученные знания в разных областях машинного обучения. Во время этого блока научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.

Вы изучите элементарные алгоритмы обработки временных рядов, модели ARIMA и GARCH, прогнозирование значений на их основе. Узнаете, что такое марковские случайные процессы и марковские модели для временных рядов.

Научитесь строить простые полносвязанные сети уровня LeNet и AlexNet и экспериментировать с их обучением. Получите теоретическую и практическую базу для использования НС в блоках CV и NLP.

Вы освоите основные техники машинного зрения — извлечение признаков, поиск по картинкам, сегментирование, детекция объектов.

4 ступень. Soft Skills и управление проектами

Овладеете методологиями управления Data Science-проектами. Научитесь формулировать идеи и гипотезы, выбирать подходящие методы и алгоритмы, планировать решение задачи.

Научитесь понимать картину мира окружающих и на основе этого строить коммуникацию. Разберётесь, как управлять своими эмоциями, как реагировать на эмоции окружающих в процессе общения и развивать эмоциональный интеллект. Узнаете, как управлять эмоциями в переговорах. Научитесь заводить полезные связи и деловые знакомства и правильно презентовать себя.

Научитесь грамотно организовывать деловые встречи и эффективно проводить переговоры, добиваясь взаимовыгодных договорённостей.

Узнаете, как презентовать идею или отчёт. Научитесь получать удовольствие от выступлений и перестанете их бояться.

В составе мини-команды за ограниченное время на основе датасетов крупных игроков рынка вам придётся решать задачи по прогнозированию продаж или оптимизации производства, задействуя все знания и навыки, полученные на курсе.

Интеграция и использование machine learning решений в бизнесе, как правило, подразумевает командную игру, поэтому хакатон полезен ещё и как тренировка необходимых soft skills.

Обучение проходит на образовательной платформе Нетологии. У вас будет личный кабинет с доступом к вебинарам, видеолекциям, дополнительным материалам, домашним заданиям и чату.
Домашние задания проверяют преподаватели и кураторы практики. Вы получите развёрнутую обратную связь и индивидуальные рекомендации.
После того, как вы завершите выполнение практических заданий и получите доступ к диплому, мы пригласим вас на программу трудоустройства от Центра развития карьеры Нетологии.

Будьте первым кто оставит отзыв.

Оставить отзыв можно только с предоставлением сертификата о прохождении курса.

Пожалуйста, войдите чтобы оставить отзыв
Data Scientist: с нуля до middle
Цена:
283 000 ₽ 169 800 ₽