YC K8s KMS NLB ALB Lockbox DNS CL CR
April 16, 2022

При создании нод группы ноды находятся в статусе NOT READY

Довольно часто возникает ситуация при которой после создания нод группы ноды не переходят в состояние READY. При этом инстансы в инстанс группе создались и находятся в состоянии RUNNING_ACTUAL.

Диагностировать проблему очень удобно с помощью команды yc:

yc k8s cluster list-nodes cluster_id 

В графе STATUS при этом можно будет увидеть, что статус ноды или одной из нод NOT READY. В поле CLOUD INSTANCE же видим статус у инстансов RUNNING ACTUAL.

Причина ошибки: инстансы создались, но по каким-то причинам не добавились в нод группу или kubelet в какой-то момент времени отвалился.

Для решения данной проблемы необходимо:
1. Определить название/идентификатор инстанса, который не добавлен в группу;
2. Заходим в консоли облака во вкладку Compute Cloud;
3. Выбираем инстанс, входящий в группу;
4. Рестартим его. Ждём когда запустится снова;
5. Повторно проверяем статус данной ноды,
6. Если рестарт не помог, то такую ноду проще удалить. Здесь скорее всего ошибка в кред демоне. Но это очень редкий случай. И сложно диагностируемый.

yc compute instance restart instance_id
yc compute instance delete instance_id

Эти же операции необходимо будет проделать со всеми инстансами у которых статус NOT READY.