Es ist schon tragisch genug, das ein per NRPE abgerufener Service-Check, ab und an nicht in der Lage ist erfolgreich abgeschlossen zu werden, weil zum Beispiel die Laufzeit zu Ausführung von standardmäßig zehn Sekunden überschritten wurde. Diese führt dann jedoch zum Status CRITICAL und das führt wiederum zu Irritationen und unnötigen Bewegungen im Arbeitsablauf. Es wäre doch viel schöner meines Erachtens nach, wenn der Service-Check stattdessen in den Status UNKNOWN läuft, was in dem Kontext auch eher der Wahrheit entspricht. Wie lösen wir das nun?

The solution: change all your check_nrpe* check_commands to use the argument “-u” additionally to the existing ones:

-u = Make socket timeouts return an UNKNOWN state instead of CRITICAL

Das ist ja verrückt und auch so einfach.