Властелин машин
@dt_analytic
Всё о передовых инструментах исследования и трюках продуктивности, чтобы стать крутым аналитиком и специалистом по машинному обучению на Python.
419 posts
инструменты аналитика

Систематизация сценария с dvc пайплайнами

В этой статье я расскажу, как систематизировать ваш сценарий, сделать код и данные воспроизводимыми с dvc пайплайнами.

Получение доступов к 3 лучшим бесплатным чат-ботам ChatGPT, GigaChat, YaGPT 2

Заходим на сайт с использованием VPN, Затем нажимаем "sign up":

OSINT по справочнику Linux 

Ниже расскажу, как правильно использовать справочник Linux, чтобы получить полное и быстрое понимание возможностей командной строки. Этот навык очень важен для любого разработчика и аналитика, которые вынуждены писать код на серверах компаний и пользоваться терминалом Linux.

Версионирование с DVC, которое упорядочит работу с данными и ml экпериментами

DVC - это продукт эволюции машинного обучения и предназначен для упрощения работы дата аналитика. В частности, он помогает создавать версии данных и моделей (большие файлы) и тем самым упорядочит ваш проект так, что его станет проще запускать коллегам, извлекать нужные версии и сравнивать результаты разных подходов. Многие принципы DVC заимствовал у Git-а, который делает то же, но для кода и небольших файлов.

Jupyter для рисования схем, диаграмм и ментальных карт

Когда я попаду на небо, первый миллион лет я буду рисовать (Уинстон Черчилль). Для этого есть хороший JavaScript инструмент - mermaid. Чтобы включить его поддержку в Jupyter, можно пойти, как минимум, двумя путями:

Серфинг по git коммитам

В Git достаточно просто перемещаться по коммитам, чтобы посмотреть прежнее состояние проекта или создать из него ветку и начать разрабатывать новую версию.