spinner-it

Python для Data Science

Старт обучения
Дату уточните у администрации
48 час. по 2-3 раза в неделю

Описание курса

Как понять, достаточно ли вы сильны для прохождения этого курса? Просто дайте самому себе ответы на следующие вопросы: интересует ли вас работа с данными (таблицами данных), манипуляции с ними и их визуализация? Помните ли вы из школы /университета/работы суть понятий «медиана», «мода», «распределение вероятностей»? Если ответы положительные, то у вас хорошие шансы на успешное прохождение курса.

 

Этот курс будет полезен:

- Специалистам, которые хотят начать карьеру в Data science;

- Специалистам по Data science, которые еще не освоили возможности работы с данными в Python;

- Специалистам, работающим с данными (аналитикам, бизнес-аналитикам, исследователям), которые хотят освоить новые гибкие инструменты для работы с данными.

 

Философия курса: обратите внимание, что этот курс не сделает из вас полноценных разработчиков на Python. С точки зрения data science, это, в первую очередь, два удобных инструменты для выполнения рабочих задач.

После курса вы сможете:

  • Понимать основные алгоритмы машинного обучения и практически их использовать для задач классификации и регрессии
  • Анализировать данные и строить модели машинного обучения с помощью языков Python
  • Делать качественные и интерактивные визуализации данных

Программа курса:

Модуль 1. Введение в машинного обучения и Data Science

  • Определение машинного обучения и науки о данных, их задачи
  • Инструментарий для анализа данных: языки программирования Python
  • Типы машинного обучения
  • Составные части модели машинного обучения
  • Базовые концепты машинного обучения

Модуль 2. Основы языков программирования Python для Data science

  • IDE для удобной работы: Jupyter, Spyder
  • Семантика языка
  • Типы данных
  • Структуры данных
  • Операторы контроля исполнения (разветвления и циклов)
  • Векторизация в Python (numpy)

Модуль 3. Функциональное программирование в Python

  • Comprehension, Generators, Iterators в Python
  • Функции в Python
  • Встроенные функции Python

Модуль 4. Исследование и подготовка данных к анализу

  • Numpy
  • Pandas

Модуль 5. Визуализация данных в Python

  • Matplotlib
  • Seaborn

Модуль 6. Основные понятия статистического анализа

  • Scipy.stats
  • Описательные статистики
  • Зависимости между переменными

Модуль 7. Типичные проблемы в подготовке данных к анализу

  • Преобразование факторных переменных
  • Борьба с пробелами в данных
  • Проблема мультиколлинеарности
  • Шкалирования данных
  • Выбор информативных переменных для модели
  • Типичный алгоритм подготовки данных к моделированию

Модуль 8. Базовые регрессионные модели

  • Линейная регрессия
  • Полиномиальная регрессия
  • Метод ближайших соседей
  • Метрики оценки качества регрессии
  • Тюнинг регрессионных моделей

Модуль 9. Базовые модели классификации

  • Логистическая регрессия
  • Метод опорных векторов
  • Наивный Байесовский классификатор
  • Метрики оценки качества классификации
  • Тюнинг параметров моделей классификации

Модуль 10. Базовые модели кластеризации и снижения размерности

  • Метод к-средних
  • Иерархический кластерный анализ
  • DBSCAN
  • Анализ
  • Кореспонденс-анализ

Модуль 11. Деревья решений и ансамбли

  • Базовые древовидные модели
  • Random forest
  • Xgboost, lightgbm
  • Тюнинг гиперпараметров в ансамблевых моделях

Модуль 12. Методы улучшения качества моделей машинного обучения

  • Аугментация
  • Feature engineering
  • Cross-validation
  • Борьба с переобучением
  • Борьба с дисбалансом данных
  • Регуляризация модели

Модуль 13. Введение в архитектуры нейронных сетей. Нейронные сети для классификации изображений

  • Keras
  • tensorflow
  • Персептрон
  • CNN

Модуль 14. Прогнозирование временных рядов

  • AR, MA, ARMA
  • ARIMA
  • VAR
  • Lstm

Модуль 15. Документация Data Science проектов, Data Science in prod

  • Пути организации продакшна для data science-проектов
  • Специфика документации data science проектов
  • Markdown, Latex

Модуль 16. Практикум по пути улучшения качества моделей

  • Презентация и обсуждение курсовых проектов
  • Подведение итогов курса

Минимальные требования:

  • Опыт программирования на любом процедурном языке
  • Знание математики в рамках школьного курса
  • Наличие собственного ноутбука для занятий в аудиториях

* Примечание: указанные скидки не суммируются с другими действующими акциями и специальными предложениями. Скидка применяется только к новым заявкам и при условии полной оплаты. Если у Вас возникли вопросы, обращайтесь за консультацией к нашим менеджерам!