Gensyn - гайд по установке ноды
RICHROAD КАНАЛ | ЧАТ | YOUTUBE
Гайд был подготовлен участником нашего сообщества за что ему большое спасибо. Оригинал гайда
Аренда сервера с видеокартой на сайте Vast.io
1. Выбираем шаблон
Я выберу PyTorch (Vast)
2. В поле Disk Space To Allocate указываем 30.00 GB
Переходим в раздел Instances и ждем, пока сервер станет активным.
Подготовим SSH-ключи для доступа к серверу
Если у вас Ubuntu или macOS, запускаем команду:
ssh-keygen -t ed25519 -C "комантар або пошта"
Нужно будет 3 раза нажать ENTER, и ключ будет создан.
Посмотреть его можно командой:
cat ~/.ssh/id_ed25519.pub
Копируем свой SSH-ключ и возвращаемся на сайт.
На арендованном сервере нажимаем значок ключа и вставляем свой SSH-ключ.
У нас появится команда для подключения к серверу, но ее нужно немного изменить: вместо 8080:localhost:8080 пишем 3000:localhost:3000
После запуска команды вводим yes
Откроется окно, где нужно ввести:
touch ~/.no_auto_tmux
Это нужно, чтобы выйти из tmux-сессии и снова зайти на сервер.
Нажимаем CTRL + D, чтобы выйти с сервера.
Затем снова вводим нашу команду для входа на сервер.
Теперь можно устанавливать все необходимые программы для ноды Gensyn:
sudo apt update && sudo apt install -y python3 python3-venv python3-pip curl wget screen git lsof nano unzip curl -sSL https://raw.githubusercontent.com/zunxbt/installation/main/node.sh | bash cd $HOME && [ -d rl-swarm ] && rm -rf rl-swarm; git clone https://github.com/zunxbt/rl-swarm.git && cd rl-swarm screen -S gensyn
После установки запускаем ноду:
cd $HOME/rl-swarm && python3 -m venv .venv && . .venv/bin/activate && ./run_rl_swarm.sh
Если у вас, как на скриншоте ниже, тогда нужно:
Перейти на сайт https://dashboard.ngrok.com, зарегистрироваться, подтвердить email и перейти на страницу https://dashboard.ngrok.com/get-started/your-authtoken, где будет ваш токен для запуска сайта.
Вводим токен на сервере — появится ссылка, по которой можно зарегистрироваться на сайте Gensyn.
переходим по ссылке, полученной в терминале.
Вводим email — придёт код на почту.
Если код не приходит, значит при входе на сервер вы не заменили 8080 на 3000.
На сервере начнётся запуск ноды.
ждём, пока установятся все внутренние зависимости.
нормальные логи должны быть такими
Когда сервер завершает обучение в определённом раунде, он будет ожидать следующие раунды.
Продолжительность одного раунда — около 90 минут.
Один раунд включает три стадии: 0, 1 и 2.
Бекап сервера
Нам нужно сохранить файл swarm.pem.
Для этого из своего терминала (не с сервера) выполняем команду:
scp -P 25209 -r root@ssh4.vast.ai:/root/rl-swarm/swarm.pem .
RICHROAD КАНАЛ | ЧАТ | YOUTUBE