Usługi publiczne rzadko przestają działać całkowicie bez żadnego sygnału ostrzegawczego. Zwykle wcześniej pojawia się kilka objawów: wydłużony czas odpowiedzi, problemy z certyfikatem, wzrost kolejek, błędy DNS, brak miejsca na dysku albo niepokojące wpisy w logach. Problem polega na tym, że bez sensownego monitoringu te sygnały pozostają niewidoczne aż do momentu, gdy zgłasza je klient albo użytkownik.

WWW: co warto obserwować oprócz statusu 200

Sama odpowiedź HTTP nie zawsze mówi, że strona działa poprawnie. W praktyce warto pilnować także:

  • czasu odpowiedzi,
  • ważności certyfikatu,
  • błędów 5xx,
  • dostępności endpointów krytycznych,
  • miejsca na dysku dla logów i cache,
  • procesów aplikacyjnych i workerów,
  • zależności od bazy i reverse proxy.

Dzięki temu łatwiej zauważyć degradację, zanim skończy się pełną niedostępnością usługi.

Poczta: gdzie zaczynają się realne problemy

Przy poczcie warto monitorować nie tylko sam port usługi, ale też rzeczy, które szybko przekładają się na kłopoty operacyjne:

  • kolejki i opóźnienia,
  • odrzucenia i błędy po stronie MTA,
  • miejsce na dysku i inode’y,
  • stan certyfikatów,
  • próby nadużyć i nietypowe logowania,
  • reputacyjne objawy spamu lub błędnych konfiguracji.

W dobrze utrzymanym środowisku poczta nie powinna zaskakiwać. Jeżeli zaskakuje, to zwykle znaczy, że wcześniej brakowało widoczności.

DNS: fundament, o którym przypomina się za późno

DNS bywa niewidoczny do momentu problemu, a wtedy okazuje się krytyczny dla całego środowiska. Warto pilnować:

  • poprawności odpowiedzi dla kluczowych rekordów,
  • czasu odpowiedzi,
  • ważności stref i zmian,
  • spójności po zmianach migracyjnych,
  • stanu serwerów autorytatywnych,
  • widoczności problemów z łącznością lub wygasaniem usług zależnych.

Co łączy te trzy obszary

WWW, poczta i DNS wymagają tego samego podejścia: monitoringu z perspektywy usługi, a nie tylko hosta. To oznacza połączenie:

  • testów dostępności,
  • monitoringu zasobów,
  • obserwacji certyfikatów,
  • analizy logów,
  • prostego alertingu z priorytetem,
  • warstwy bezpieczeństwa dla usług publicznych.

W praktyce najlepiej działa to wtedy, gdy monitoring infrastruktury jest połączony z hardeningiem usług publicznych oraz z monitoringiem infrastruktury IT.

Krótka lista kontrolna

Jeżeli chcesz szybko ocenić stan usług publicznych, sprawdź:

  • czy monitoring obejmuje realną dostępność z punktu widzenia użytkownika,
  • czy ktoś śledzi certyfikaty i ich terminy,
  • czy kolejki, logi i błędy mają sensowny alerting,
  • czy po zmianach w DNS i WWW wykonywana jest kontrola działania,
  • czy usługi publiczne są także objęte warstwą bezpieczeństwa.

Podsumowanie

WWW, poczta i DNS to nie tylko „działające porty”. To usługi, które wymagają przewidywalnego nadzoru, bo drobne objawy bardzo często pojawiają się zanim dojdzie do awarii widocznej dla użytkownika. Dobrze zorganizowany monitoring i porządek w utrzymaniu pozwalają te sygnały zobaczyć wcześniej.

Powiązane artykuły

Jeżeli chcesz ograniczyć szum alertowy i skupić się na sygnałach, które naprawdę mają znaczenie, zobacz też artykuł Monitoring infrastruktury IT bez szumu.