kubernetes errors
August 12, 2023

Orphaned pod pod_id found, but error not a directory occurred when trying to remove the volumes dir

Воспроизводится на версиях Kubernetes до 1.24.

Это баг на стороне стораджа. Стреляет когда были проблемы с нодой, например, в результате нештатной перезагрузки.

Помогает удаление связанной с подом директории из /var/lib/kubelet/pods

Для примера можно использовать решение отсюда:
https://github.com/kubernetes/kubernetes/issues/105536?ysclid=ll6te4b7x91590084#issuecomment-1612347166

#!/bin/bash
while true
do
        tail /var/log/k8s-service.log | grep "orphaned pod" | awk '{print $18}' | cut -d\\ -f2 | cut -d\" -f2 | uniq | xargs -I % sh -c 'echo "deleting /var/lib/kubelet/pods/%"; rm -rf /var/lib/kubelet/pods/%;'
        sleep 1
done