kubernetes errors
August 12, 2023
Orphaned pod pod_id found, but error not a directory occurred when trying to remove the volumes dir
Воспроизводится на версиях Kubernetes до 1.24.
Это баг на стороне стораджа. Стреляет когда были проблемы с нодой, например, в результате нештатной перезагрузки.
Помогает удаление связанной с подом директории из /var/lib/kubelet/pods
Для примера можно использовать решение отсюда:
https://github.com/kubernetes/kubernetes/issues/105536?ysclid=ll6te4b7x91590084#issuecomment-1612347166
#!/bin/bash while true do tail /var/log/k8s-service.log | grep "orphaned pod" | awk '{print $18}' | cut -d\\ -f2 | cut -d\" -f2 | uniq | xargs -I % sh -c 'echo "deleting /var/lib/kubelet/pods/%"; rm -rf /var/lib/kubelet/pods/%;' sleep 1 done