Data Scientist

61 студент зачислен

Длительность обучения

16 месяцев

Трудоустройство

Поможем найти работу или стажировку

Документ

Диплом о профессиональной переподготовке

Кому подойдёт этот курс

Новичкам в Data Science

С нуля овладеете знаниями и навыками, необходимыми для работы Data Scientist, и получите новую востребованную профессию.

Аналитикам

Научитесь извлекать максимум из больших массивов данных для быстрой проверки гипотез и построения прогнозов. Систематизируете знания и углубитесь в Data Science.

Разработчикам

Курс даёт хорошую базу для перехода из программирования в Data Science. Вас ждёт много практики, разбор кейсов и новые полезные знакомства.

Чему вы научитесь

Работать с SQL

Научитесь писать запросы, работать с данными в базе без переноса в таблицы, загружать данные и сохранять историю, работать с разными форматами файлов

Проверять данные и определять проблемы

Обрабатывать текстовые данные, чтобы передавать их в алгоритмы машинного обучения, генерировать новые значимые признаки

Применять математику

Освоите необходимый математический аппарат для продуктивной работы с моделями данных, машинным обучением и нейронными сетями

Использовать Python и библиотеки

Автоматизировать работу с большими массивами, получать данные из внешних источников, обосновывать выводы, сделанные на основании данных

Строить модели машинного обучения

Быстро строить модели и проверять гипотезы, строить рекомендательные системы, обучать нейросети, выявлять скрытые аномалии в данных

Лидировать DS-проекты

Структурировать результаты, формулировать гипотезы, выявлять потребности, находить области применения машинного обучения, оценивать целесообразность разных методов

Содержание курса

Научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, импортировать и экспортировать — без помощи разработчиков.

20 часов теории

32 часа практики

Введение в SQL.Установка и знакомство
Основы SQL

Работа с базой данных PostgreSQL

Основы и работа с базами данных

Углубление в SQL

 

Научитесь получать и очищать данные, находить связи и проверять гипотезы.
Сможете работать с главными аналитическими библиотеками.

68 часов теории

87 часов практики

Основы Python: Jupiter Notebook, комментарии в коде, арифметические операции

Управляющие конструкции и коллекции

Функции и работа с данными, основы парсинга

Работа с файловой системой и модули

Исключения и обработка ошибок

Функции и понятие класса

Регулярные выражения и основы синтаксического разбора

Бонусные видеолекции по Git

Библиотека NumPy: вычислительные задачи

Библиотека Pandas: возможности и оптимизация

Функции и работа с данными

Методы оптимизации pandas

Основы вебскрапинга

Базовые понятия статистики. Изучение данных: статистика и исследовательский анализ

Случайные события. Случайные величины

Корреляция и корреляционный анализ

Задачи классификации и кластеризации

Доверительные интервалы. Статистическая проверка гипотез для несвязанных выборок

Статистическая проверка гипотез для связанных выборок.
A/B тесты и как их проводить

Освоите математический аппарат Data Science. Начнёте понимать принципы работы существующих методов анализа данных. Сможете выбирать подходящие алгоритмы и корректно интерпретировать результаты.

9 часов теории

37 часов практики

Основные математические понятия для Data Science

Продвинутая линейная алгебра

Математический анализ. Производные функции нескольких переменных

Теория оптимизации

Линейная алгебра. Матрицы

Основы статистики

Математический анализ. Производные функции одной переменной

Продвинутая оптимизация

Теория вероятностей

Сможете проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas и сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Начнёте использовать Random Forest в задачах классификации.

42 часа теории

37 часов практики

Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия

Функции потерь и оптимизация

Проблема качества данных

Работа с переменными

Ансамблирование

Feature selection

Алгоритмы кластеризации

Классификация: Логистическая регрессия и SVM

Оценка точности модели, переобучение, регуляризация

Работа с пропусками

Деревья решений

Поиск выбросов и генерация новых признаков

Метрики близости. Работа с текстовыми данными. Наивный Байес

Улучшение качества модели

Название занятия

Начнёте применять полученные знания в разных областях машинного обучения. Научитесь строить персонализированные и неперсонализированные рекомендательные системы, а также комбинировать их.

10 часов теории

9 часов практики

Введение и классификация рекомендательных систем

Коллаборативная фильтрация

Гибридные рекомендательные системы

Рекомендации на основе содержания

Рекомендации на основе скрытых факторов

 

Будьте первым кто оставит отзыв.

Оставить отзыв можно только с предоставлением сертификата о прохождении курса.

Пожалуйста, войдите чтобы оставить отзыв
Цена:
216 500 ₽ 129 900 ₽