В этой статье я расскажу, как систематизировать ваш сценарий, сделать код и данные воспроизводимыми с dvc пайплайнами.
Заходим на сайт с использованием VPN, Затем нажимаем "sign up":
Ниже расскажу, как правильно использовать справочник Linux, чтобы получить полное и быстрое понимание возможностей командной строки. Этот навык очень важен для любого разработчика и аналитика, которые вынуждены писать код на серверах компаний и пользоваться терминалом Linux.
DVC - это продукт эволюции машинного обучения и предназначен для упрощения работы дата аналитика. В частности, он помогает создавать версии данных и моделей (большие файлы) и тем самым упорядочит ваш проект так, что его станет проще запускать коллегам, извлекать нужные версии и сравнивать результаты разных подходов. Многие принципы DVC заимствовал у Git-а, который делает то же, но для кода и небольших файлов.
Когда я попаду на небо, первый миллион лет я буду рисовать (Уинстон Черчилль). Для этого есть хороший JavaScript инструмент - mermaid. Чтобы включить его поддержку в Jupyter, можно пойти, как минимум, двумя путями:
В Git достаточно просто перемещаться по коммитам, чтобы посмотреть прежнее состояние проекта или создать из него ветку и начать разрабатывать новую версию.