При создании нод группы ноды находятся в статусе NOT READY
Довольно часто возникает ситуация при которой после создания нод группы ноды не переходят в состояние READY. При этом инстансы в инстанс группе создались и находятся в состоянии RUNNING_ACTUAL.
Диагностировать проблему очень удобно с помощью команды yc:
yc k8s cluster list-nodes cluster_id
В графе STATUS при этом можно будет увидеть, что статус ноды или одной из нод NOT READY. В поле CLOUD INSTANCE же видим статус у инстансов RUNNING ACTUAL.
Причина ошибки: инстансы создались, но по каким-то причинам не добавились в нод группу или kubelet в какой-то момент времени отвалился.
Для решения данной проблемы необходимо:
1. Определить название/идентификатор инстанса, который не добавлен в группу;
2. Заходим в консоли облака во вкладку Compute Cloud;
3. Выбираем инстанс, входящий в группу;
4. Рестартим его. Ждём когда запустится снова;
5. Повторно проверяем статус данной ноды,
6. Если рестарт не помог, то такую ноду проще удалить. Здесь скорее всего ошибка в кред демоне. Но это очень редкий случай. И сложно диагностируемый.
yc compute instance restart instance_id yc compute instance delete instance_id
Эти же операции необходимо будет проделать со всеми инстансами у которых статус NOT READY.