• 1 июля 2017, суббота
  • Москва, Ул. Ф.Энгельса, д.75, стр.11

Анализ данных и предсказательные модели в Python

Регистрация на событие закрыта

Извините, регистрация закрыта. Возможно, на событие уже зарегистрировалось слишком много человек, либо истек срок регистрации. Подробности Вы можете узнать у организаторов события.

Другие события организатора

2462 дня назад
с 10:00 1 июля до 18:00 2 июля 2017
Москва
Ул. Ф.Энгельса, д.75, стр.11

Данный курс познакомит вас с основами языка программирования Python, научит с его помощью делать статистические выводы на основе данных, а также строить модели для предсказания поведения клиентов (линейная и логистическая регрессия, деревья решений, нейросети). Будет интересно!

Для кого?

Все профессионалы, работа которых включает в себя анализ больших массивов данных – в маркетинге, кредитных рисках, вторичных продажах, бизнес-аналитике, HR, IT и т.д.

Для чего?

  •  «Смотреть» на большие данные: обрабатывать, агрегировать, визуализировать
  • Строить модели машинного обучения для предсказания количественных и качественных признаков (отклика, кредитного риска, и т.п.)

Ключевые сюжеты обучения:

Дан максимальный объём материала (рассчитанный на 16 аудиторных часов):

  1. Основы синтаксиса Python, работа с элементарными типами данных и структурами данных.
  2. Предварительная работа с данными: выгрузка, работа с таблицами, трансформация, агрегирование, визуализация.
  3. Краткий ликбез по теории вероятностей и статистике. Проверка гипотез на данных.
  4. Линейный регрессионный анализ.
  5. Задача кредитного скоринга. Модели для вероятностной классификации: линейная и логистическая регрессия, решающие деревья. ROC-кривая.
  6. Как понять, что машинное обучение вам нужно. Краткий обзор популярных методов машинного обучения. Проблема переобучения и способы регуляризации моделей.
  7. Ансамбли решающих деревьев: алгоритмы жадного разбиения + бэггинг + градиентный бустинг. Пакет XGBoost.
  8. Нейронные сети: теорема о представлении + градиентный спуск + специальные архитектуры (свёрточные, рекуррентные, и т.п.). Пакеты Tensorflow и Keras.
  9. Обучение без учителя: иерархическая кластеризация, k-means, PCA. Создание признаков.
  10. Практикум по анализу данных.

Чего не будет?

На обучении не будет идти речь о:

  • Сборе данных
  • Хранилищах данных
  • Инструментах работы с реально большими данными (Hadoop, MapReduce, и т.п.)
  • Внедрении предсказательных моделей в production
  • Сильном искусственном интеллекте =)

Ключевые слова (теги):

Обучение, Альфа-Банк, анализ данных, моделирование, машинное обучение, Python, data mining, big data, кредитный риск

Длительность обучения:

2 дня, c 10 до 18.

По окончании занятия выдается сертификат.

Для более эффективного обучения рекомендуем использовать свой ноутбук с установленной Anaconda на Python 3.

Подробнее: http://learn.alfabank.ru

Для студентов ВУЗов: у вас есть возможность получить бесплатный билет или большую скидку на данное обучение. Для этого участвуйте в конкурсе: подробнее - здесь.

Преподаватель

%d0%94%d0%b0%d0%bb%d0%b5 %d1%81%d0%b0%d0%b9%d1%82
Давид Дале
Эксперт по риск-аналитике и анализу данных, Альфа-Опыт

Регистрация

Рекомендуемые события

Организуете события? Обратите внимание на TimePad!

Профессиональная билетная система, статистика продаж 24/7, выгрузка списков участников, встроенные инструменты продвижения, личный кабинет для самостоятельного управления и еще много чего интересного.

Узнать больше