С чего начать обучение Data Science
При некотором стремлении каждый из нас может освоить современную профессию data scientist-а. Она предполагает знание основ языка программирования Python или R. Второй в силу меньшей универсальности все больше утрачивает популярность.
Для освоения Python рекомендую книги «Python 3. Самое необходимое» (Н. Прохоренок, В. Дронов) или «Простой Python. Современный стиль программирования» (Б. Любанович), так как в них раскрывается достаточный набор тем общего характера для комфортного использования Python в анализе.
Специализированный материал же отлично раскрывают две книги «Python для сложных задач: наука о данных и машинное обучение» (Дж. Вандер Плас) и «Python и машинное обучение» (С. Рашка, В. Мирджалили).
В первой книге освещен основной инструментарий машинного обучения (ввод, обработка, визуализация, алгоритмы машинного обучения), материал хорошо структурирован. В то же время теоретические основы работы алгоритмов детально не освещаются, также не затрагивается тема глубокого обучения. В «Python и машинное обучение» хорошо подается теория и практика, материал систематизирован, и поэтому пособие может быть использовано в качестве справочника . Вместе с тем вопросы обработки и визуализации данных широко не раскрываются, а затрагиваются только в контексте приводимых примеров. Таким образом, пособия хорошо дополняются друг друга.
Онлайн курсов просто море, в частности, их можно приобрести в Яндекс Практикуме, «Нетологии», Skillfactory, Skillbox, GeekBrains и OTUS. Из бесплатных могу посоветовать "Введение в Data Science и машинное обучение" и набор других бесплатных предложений Института биоинформатики, которые можно найти по ссылке. Их плюсом является то, что по итогам можно получить электронный сертификат, что обычно для бесплатных курсов не подразумевается.
Для решения практических задач используйте бесплатную среду Google Colab, для входа в которую достаточно иметь почту gmail.