April 8, 2025

Gensyn

Оренда сервера з відеокартою на https://cloud.vast.ai/

1 вибираємо шаблон з

Я виберу PyTorch (Vast)

2 там де Disk Space To Allocate - вписуємо 30.00 GB

3 вписуємо відеокарту 3090

4 сортуємо по ціні

5 орендуємо

переходимо у Instances і очікуємо коли сервер стане активний

Підготуємо ssh ключі для доступу до сервера

Якщо у вас Ubuntu/MacOS
Запускаємо команду

ssh-keygen -t ed25519 -C "комантар або пошта"

Нам потрібно буде нажати ENTER 3 рази і ключ створиться

Переглянути можна командою

cat ~/.ssh/id_ed25519.pub

Копіюємо свій ssh ключ і повертаємось на сайт

На орендованому сервері нажимаємо ключик і вписуємо свій ssh ключ

у нас появиться команда для доступу до сервера але нам її треба трохи поміняти і замість 8080:localhost:8080 поставити 3000:localhost:3000

у нас получиться команда

далі вписати yes

у нас відкриється вікно у якому треба вписати touch ~/.no_auto_tmux щоб вийти з сесії tmux і перезайти на сервер

CTRL + D - вийти з сервера

потім знову наша команда входу на сервер

тепер можемо встановлювати всі потрібні програми для ноди Gensyn

sudo apt update && sudo apt install -y python3 python3-venv python3-pip curl wget screen git lsof nano unzip
curl -sSL https://raw.githubusercontent.com/zunxbt/installation/main/node.sh | bash
cd $HOME && [ -d rl-swarm ] && rm -rf rl-swarm; git clone https://github.com/zunxbt/rl-swarm.git && cd rl-swarm
screen -S gensyn

після встановлення запускаємо ноду

cd $HOME/rl-swarm && python3 -m venv .venv && . .venv/bin/activate && ./run_rl_swarm.sh

Якщо у вас так як на скріні нижче то треба

Перейти на сайт https://dashboard.ngrok.com і зареєстуватись і підтвердити на пошті реєстрацію і перейти потім на сайт https://dashboard.ngrok.com/get-started/your-authtoken - там буде наш токен для того щоб сайт запрацював

Вписуємо токен на сервері і у нас появиться посилання за яким можна буде пройти реєстрацію на сайті gensyn

переходимо за посиланням яке получили у терміналі

вписуємо пошту і получаємо код на пошту - якщо не приходить код значить під час логіну на сервер ви не замінили значення 3000:localhost:3000

а на сервері почнеться запуск ноди

очікуємо поки встановляться внутрішні залежності для ноди

Тут нажимаємо ENTER

готово

номальні логи далі повинні бути ось такі



Коли сервер закінчить тренування у певному раунді то буде очікувати наступні раунди

Тривалість одного раунду - приблизно 90хв
Один раунт має три стейджі (0,1,2)

Бекап

Нам потрібно зберегти файл swarm.pem, для цього з свого термінулу(не з сервера) виконуємо команду

scp -P 25209 -r root@ssh4.vast.ai:/root/rl-swarm/swarm.pem .