April 24, 2020

Анализ данных: где лучше учиться?

Поговорим про одну из самых хайповых тем обучения - анализ данных.

Мы в T&D регулярно получаем заявки на обучение анализу данных на внешних площадках.
Сейчас хотим поделиться рекомендациями и антирекомендациями на основании опыта наших сотрудников.

Совсем бесплатные курсы:

Stepik.org

Можно получить неплохую базу в области анализа данных на абсолютно бесплатных ресурсах. Если вы новичок, то обязательно начните со stepik.org. Stepik публикует короткие доходчивые курсы, которые помогут быстро приобрести или восстановить знания по матстатистике или основам программирования (начинаем с Python или R). Авторы курсов - питерский Институт биоинформатики, университет ИТМО и Computer Science Center.
Если вы заглядываетесь на машинное обучение, то на том же stepik недавно выпущен (бесплатный!) курс по введению в ML. А также не проходите мимо классического курса от Open Data Science (сейчас доступен в англоязычной версии).

Data Mining in Action

Что может пойти не так: вам неудобно учиться исключительно онлайн и нужна помощь менторов. И даже в этом случае есть отличный бесплатный вариант: школа Data Mining in Action, которую организуют ex-сотрудники Яндекс и авторы, пожалуй, самой известной специализации по анализу данных на Coursera (о ней в следующем разделе). Школа проводится два раз в год, в весенний и осенний семестр, на базе университета МИСиС. Для поступления необходимо пройти конкурс, но качественной проработки курсов на stepik вам для этого хватит.

Классно и недорого:

DataCamp.com и Coursera.org

На DataCamp удобно брать отдельные курсы по конкретным технологиям (R, Python, SQL, Excel) и постепенно наращивать уровень.
Coursera это тоже позволяет, но предлагает и более комплексный образовательный продукт - специализации. Специализация позволяет последовательно овладевать несколькими важными навыками, закрепляя их в итоговом проекте.
Самые известные курсы и специализации по анализу данных: Введение в ML от Эндрю Ына, специализация Машинное обучение и анализ данных от Яндекс и МФТИ, погружение в Python от университета Мичигана.
Спойлер: в скором времени Coursera обещает выпустить новый образовательный формат - проекты. Это предполагает обучение исключительно через решение практических задач (код! много кода) с регулярным ревью от экспертов.
Важно: Datacamp платный, на Coursera можно учиться бесплатно, но теряя ряд полезных опций (например, проверка домашних заданий менторами курса). Полноценное платное обучение обойдется примерно в 4,5 т.р. за стандартный месячный курс, соответственно, порядка 27 т.р. за полугодовую специализацию. Ощутимо, но вполне реально :)
К тому же при наличии бизнес-необходимости вы можете компенсировать стоимость обучения за счет банка.

Курсы и школы подороже:

Здесь всё не так очевидно (то, что мы точно не можем порекомендовать на опыте наших коллег):

Не стоит ходить на курсы, организованные коммерческими необразовательными организациями под своим брендом. Чаще всего цель такого обучения не собственно образовательная, а, скорее, лежит в области найма сотрудников.
Вы можете получить полезные знания, но часть из них может быть применима только к области деятельности самой компании-хоста курса.
Пожалуй, здесь только одно исключение - Школа Анализа Данных (ШАД) Яндекса. Это один из самых сложных и комплексных вариантов обучения анализу данных в России сейчас: если вы поступите (!) и закончите (!!) обучение в ШАД с успехом (!!!), то можете с уверенностью отметить свой skill 80 lvl.

Что же делать?

Выбирать курсы от неаффилированных компаний, хорошо зарекомендовавших себя на практике.
Например, отличная школа DataGym от сотрудников Mail.ru и Lamoda, в настоящий момент работающая онлайн. Преподаватели курса читают в большинстве открытых школ по анализу данных и ML и иногда проводят тренинги для менеджеров Райфа. Для тех, кто развивается в направлении Big Data, есть много полезных программ в школе NewProLab.
Если вы прошли какое-то обучение онлайн и вам понравилось - попробуйте поискать другие проекты того же эксперта. Чаще всего вы что-то найдете.
Например, автор нескольких курсов по анализу данных на stepik сейчас запустил расширенную платную программу по Python. Это может стать хорошим выбором!


Больше рекомендаций, а также ответы на практические вопросы (какой курс лучше выбрать? Как получить компенсацию за обучение?) - на лендинге проекта Raiffeisen Data University (только из сети банка, перешлите себе данную статью, либо вбейте вручную - http://shrtr/rdu1~) и в почте rdu@raiffeisen.ru.