Длительность обучения
9 месяцев
Формат
Видеолекции, вебинары, митапы, задания с проверкой
Документ
Диплом о профессиональной переподготовке
Data Science — одно из самых востребованных направлений в IT
Data Scientist помогает бизнесу оптимизировать процессы и выбирать стратегии развития. Специалист структурирует и анализирует большие массивы данных, находит закономерности и делает на их основе полезные для компании выводы.
Поисковые системы, рекомендательные сервисы, голосовые помощники, сервисы распознавания лиц — всё это создано с участием дата-сайентистов.
Кому подойдёт этот курс
Новичкам
С нуля овладеете знаниями и навыками, необходимыми для работы в перспективной сфере
Аналитикам
Углубитесь в Data Science, систематизируете знания и повысите свою ценность на рынке труда
Разработчикам
Расширите компетенции и получите базу для перехода из программирования в анализ больших данных
Чему вы научитесь
Работать с базами данных с помощью SQL
Поймёте, как с помощью SQL получать, фильтровать, агрегировать, импортировать и экспортировать данные
Обрабатывать данные и определять проблемы
Научитесь очищать данные, проверять их на полноту, целостность, наличие шумов, ошибок и пропусков
Применять математику и статистику
Освоите необходимый математический минимум для выбора подходящих алгоритмов и интерпретации результатов
Использовать Python и его библиотеки
Разберётесь, как пользоваться базовыми инструментами и подходами в Python
Проектировать модели машинного обучения
Сможете строить рекомендательные системы, выявлять скрытые аномалии в данных
Обучать нейронные сети
Получите теоретическую и практическую базы для использования нейросетей в решении разных задач
Содержание курса
Научитесь получать данные для анализа без помощи разработчиков, объяснять архитектуру и структуру базы данных, писать простые и сложные SQL-запросы, группировать, агрегировать и фильтровать данные из баз данных, использовать PostgreSQL, работать с разными форматами файлов.
20 часов теории
32 часа практики
Базы данных
Основы SQL
Итоговый проект
Работа с PostgreSQL
Лабораторная работа
Научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными.
52 часа теории
43 часа практики
Основы Python: Jupiter Notebook, комментарии в коде, арифметические операции, переменные, условные конструкции
Регулярные выражения и основы синтаксического разбора
Бонусные видеолекции по Git
Работа с файловой системой и модули
Библиотека NumPy: вычислительные задачи
Основы парсинга
Продвинутый Pandas: оптимизация, сводные таблицы, методы работы со строками, объединения датафреймов, конкатенация таблиц, оптимизация хранения данных
Функции
Понятие класса
Управляющие конструкции и коллекции
Исключения и обработка ошибок
Функции и работа с данными
Библиотека Pandas: обзор возможностей и базовые операции
Лабораторная работа
Научитесь исследовать данные и делать выводы, формулировать и проверять гипотезы. Познакомитесь с описательной статистикой и видами распределений. Изучите статистические критерии.
8 часов теории
10 часов практики
Основы статистики
Основные статистические показатели. Корреляция
Статистические критерии. Проверка гипотез и формулирование выводов
Основные статистические показатели. Виды распределений данных
Взаимосвязи данных и формулирование гипотез по SMART
Итоговое задание
Освоите математический аппарат Data Science для понимания принципов работы существующих методов анализа данных, выбора подходящих алгоритмов и корректной интерпретации результатов.
9 часов теории
37 часов практики
Линейная алгебра
Теория оптимизации
Итоговый проект
Математический анализ
Теория вероятностей и основы статистики
Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, сокращать размерности данных алгоритмами PCA, LDA, NMF. Поймёте, как строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Сможете использовать Random Forest в задачах классификации.
42 часа теории
37 часов практики
Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия
Функции потерь и оптимизация
Проблема качества данных
Работа с переменными
Ансамблирование
Feature selection
Алгоритмы кластеризации
Классификация. Логистическая регрессия и SVM
Оценка точности модели, переобучение, регуляризация
Работа с пропусками
Деревья решений
Поиск выбросов и генерация новых признаков
Метрики близости. Работа с текстовыми данными. Наивный Байес
Улучшение качества модели
Итоговый проект
Будьте первым кто оставит отзыв.
Оставить отзыв можно только с предоставлением сертификата о прохождении курса.
Популярные курсы
-
Онлайн-курс для подростков «Стресс...3 900 ₽От Детская бизнес-школа ITC Group
-
MBA: Менеджмент в медицине, програ...350 000 ₽От Emas
-
MBA: Стратегический менеджмент, ди...315 000 ₽От Emas
-
Executive MBA ǀ 1 год385 000 ₽От Emas
-
Executive MBA: Стратегический мене...385 000 ₽От Emas
-
DBA: Стратегический менеджмент, ди...505 000 ₽От Emas