Data Mining in Action
Курс по машинному обучению и анализу данных
Открыт набор на осень 2019
Начало семестра — 5 октября
Заполнить анкету
Направления обучения
У каждого направления DMIA свой курс лекций и набор домашних заданий:
Базовое направление
Основные понятия, популярные классические алгоритмы машинного обучения, оценка качества, введение в нейронные сети
Deep Learning
Знакомство с нейронными сетями с самого начала, с разбором особенностей применения в анализе изображений и текста
Индустрия
Что нужно знать для применения машинного обучения в компании глазами технического специалиста с опытом внедрения машинного обучения
Спорт
Как выигрывать в соревнованиях по машинному обучению: тонкости обучения самых точных моделей
Курс Data Mining in Action возник из стартовавшего в 2011 году в стенах Физтеха факультатива по машинному обучению
Программы направлений
Длительность одного курса - 10 недель
Базовое направление
  1. Введение: примеры применения, основные понятия, стандартные задачи
  2. Математика в анализе данных и простые методы
  3. Линейные модели
  4. Решающие деревья и ансамбли
  5. Работа с признаками
  6. Оценка качества (офлайн и онлайн)
  7. Обучение без учителя: кластеризация, преобразование признаков, обучение векторных представлений
  8. Нейронные сети: введение. Принципы работы и обучение.
  9. Сверточные нейронные сети
  10. Рекуррентные нейронные сети
Индустрия
  1. Flow и роли в data science команде, знакомство с инструментами
  2. Предпроектная стадия, предварительный анализ и визуализация данных
  3. Нюансы обучения и применения на практике ансамблей деревьев
  4. Линейные модели и нейронные сети: в каких задачах и как применять
  5. Метрики качества и функции потерь: на что влияют и как выбирать
  6. Постановка задач машинного обучения
  7. Внедрение: проектирование и прототипирование ML сервиса
  8. Оптимизация кода в задачах анализа данных
  9. Сбор данных
  10. Валидация после внедрения: А/В тестирование – базовые и продвинутые методы
Deep Learning
  1. Введение в DL
  2. Нейронные сети и оптимизация
  3. Тренировка нейронных сетей
  4. Классификация изображений
  5. Детекция и сегментация
  6. Генеративные модели
  7. Основные задачи NLP
  8. Латентные представления (эмбеддинги)
  9. Adversarial Learning
  10. Нестандартные применения DL
Спорт
  1. Отборочное соревнование
  2. Введение: соревнования, платформы, напоминание ML
  3. Exploratory Data Analisys (EDA)
  4. Валидация качества и построение бейзлайна
  5. Тюнинг моделей
  6. Feature engineering
  7. Advanced feature engineering
  8. Кодирование средним
  9. Ансамбли моделей: усреднение, блендинг, стэкинг
  10. Участие в хакатонах
Сейчас DMIA проводится при участии индустриальных партнеров из числа IT-компаний, банков и интеграторов
Партнеры курса
С 2018 года занятия проходят на территории нашего образовательного партнера НИТУ «МИСиС»
Руководители DMIA
Эмели Драль

  • Chief Data Scientist и co-founder Mechanica AI.
  • Руководила службой анализа больших данных Yandex Data Factory, работала в Яндексе, Рамблере и других компаниях.
  • Преподаёт машинное обучение в Harbour.Space University
  • Соавтор специализации "Машинное обучение и анализ данных" на платформе Coursera
Эмели Драль

  • Chief Data Scientist и co-founder Mechanica AI.
  • Руководила службой анализа больших данных Yandex Data Factory, работала в Яндексе, Рамблере и других компаниях.
  • Преподаёт машинное обучение в Harbour.Space University
  • Соавтор специализации "Машинное обучение и анализ данных" на платформе Coursera
Виктор Кантор

  • Эксперт в области машинного обучения с фокусом на прикладное применение в компаниях, преподаватель
  • Занимался Data Science и образовательными проектами в ABBYY и Яндексе, руководил группой анализа пользовательского поведения в Yandex Data Factory, с нуля выстроил службу машинного обучения Яндекс.Такси, отвечающую за все задачи применения Data Science для решения потребностей бизнеса и улучшения продукта
  • Преподаёт машинное обучение в МФТИ
  • Соавтор специализации "Машинное обучение и анализ данных" на платформе Coursera
Виктор Кантор

  • Эксперт в области машинного обучения с фокусом на прикладное применение в компаниях, преподаватель
  • Занимался Data Science и образовательными проектами в ABBYY и Яндексе, руководил группой анализа пользовательского поведения в Yandex Data Factory, с нуля выстроил службу машинного обучения Яндекс.Такси, отвечающую за все задачи применения Data Science для решения потребностей бизнеса и улучшения продукта
  • Преподаёт машинное обучение в МФТИ
  • Соавтор специализации "Машинное обучение и анализ данных" на платформе Coursera
Скоро: онлайн-курс DMIA
Зимой 2020 года запускается онлайн-версия базового направления Data Mining in Action с расширенной программой. Подписывайтесь на новости о запуске, чтобы не пропустить!
Made on
Tilda