Data Scientist: старт в профессии

42 студента зачислены

Длительность обучения

9 месяцев

Формат

Видеолекции, вебинары, митапы, задания с проверкой

Документ

Диплом о профессиональной переподготовке

Data Science — одно из самых востребованных направлений в IT

Data Scientist помогает бизнесу оптимизировать процессы и выбирать стратегии развития. Специалист структурирует и анализирует большие массивы данных, находит закономерности и делает на их основе полезные для компании выводы.

Поисковые системы, рекомендательные сервисы, голосовые помощники, сервисы распознавания лиц — всё это создано с участием дата-сайентистов.

Кому подойдёт этот курс

Новичкам

С нуля овладеете знаниями и навыками, необходимыми для работы в перспективной сфере

Аналитикам

Углубитесь в Data Science, систематизируете знания и повысите свою ценность на рынке труда

Разработчикам

Расширите компетенции и получите базу для перехода из программирования в анализ больших данных

Чему вы научитесь

Работать с базами данных с помощью SQL

Поймёте, как с помощью SQL получать, фильтровать, агрегировать, импортировать и экспортировать данные

Обрабатывать данные и определять проблемы

Научитесь очищать данные, проверять их на полноту, целостность, наличие шумов, ошибок и пропусков

Применять математику и статистику

Освоите необходимый математический минимум для выбора подходящих алгоритмов и интерпретации результатов

Использовать Python и его библиотеки

Разберётесь, как пользоваться базовыми инструментами и подходами в Python

Проектировать модели машинного обучения

Сможете строить рекомендательные системы, выявлять скрытые аномалии в данных

Обучать нейронные сети

Получите теоретическую и практическую базы для использования нейросетей в решении разных задач

Содержание курса

Научитесь получать данные для анализа без помощи разработчиков, объяснять архитектуру и структуру базы данных, писать простые и сложные SQL-запросы, группировать, агрегировать и фильтровать данные из баз данных, использовать PostgreSQL, работать с разными форматами файлов.

20 часов теории

32 часа практики

Базы данных

Основы SQL

Итоговый проект

Работа с PostgreSQL

Лабораторная работа

 

Научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными.

52 часа теории

43 часа практики

Основы Python: Jupiter Notebook, комментарии в коде, арифметические операции, переменные, условные конструкции

Регулярные выражения и основы синтаксического разбора

Бонусные видеолекции по Git

Работа с файловой системой и модули

Библиотека NumPy: вычислительные задачи

Основы парсинга

Продвинутый Pandas: оптимизация, сводные таблицы, методы работы со строками, объединения датафреймов, конкатенация таблиц, оптимизация хранения данных

Функции

Понятие класса

Управляющие конструкции и коллекции

Исключения и обработка ошибок

Функции и работа с данными

Библиотека Pandas: обзор возможностей и базовые операции

Лабораторная работа

 

Научитесь исследовать данные и делать выводы, формулировать и проверять гипотезы. Познакомитесь с описательной статистикой и видами распределений. Изучите статистические критерии.

8 часов теории

10 часов практики

Основы статистики

Основные статистические показатели. Корреляция

Статистические критерии. Проверка гипотез и формулирование выводов

Основные статистические показатели. Виды распределений данных

Взаимосвязи данных и формулирование гипотез по SMART

Итоговое задание

Освоите математический аппарат Data Science для понимания принципов работы существующих методов анализа данных, выбора подходящих алгоритмов и корректной интерпретации результатов.

9 часов теории

37 часов практики

Линейная алгебра

Теория оптимизации

Итоговый проект

Математический анализ

Теория вероятностей и основы статистики

 

Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, сокращать размерности данных алгоритмами PCA, LDA, NMF. Поймёте, как строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Сможете использовать Random Forest в задачах классификации.

42 часа теории

37 часов практики

Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия

Функции потерь и оптимизация

Проблема качества данных

Работа с переменными

Ансамблирование

Feature selection

Алгоритмы кластеризации

Классификация. Логистическая регрессия и SVM

Оценка точности модели, переобучение, регуляризация

Работа с пропусками

Деревья решений

Поиск выбросов и генерация новых признаков

Метрики близости. Работа с текстовыми данными. Наивный Байес

Улучшение качества модели

Итоговый проект

Будьте первым кто оставит отзыв.

Оставить отзыв можно только с предоставлением сертификата о прохождении курса.

Пожалуйста, войдите чтобы оставить отзыв
Data Scientist: старт в профессии
Цена:
168 000 ₽ 100 800 ₽