Usługi publiczne rzadko przestają działać całkowicie bez żadnego sygnału ostrzegawczego. Zwykle wcześniej pojawia się kilka objawów: wydłużony czas odpowiedzi, problemy z certyfikatem, wzrost kolejek, błędy DNS, brak miejsca na dysku albo niepokojące wpisy w logach. Problem polega na tym, że bez sensownego monitoringu te sygnały pozostają niewidoczne aż do momentu, gdy zgłasza je klient albo użytkownik.
WWW: co warto obserwować oprócz statusu 200
Sama odpowiedź HTTP nie zawsze mówi, że strona działa poprawnie. W praktyce warto pilnować także:
- czasu odpowiedzi,
- ważności certyfikatu,
- błędów 5xx,
- dostępności endpointów krytycznych,
- miejsca na dysku dla logów i cache,
- procesów aplikacyjnych i workerów,
- zależności od bazy i reverse proxy.
Dzięki temu łatwiej zauważyć degradację, zanim skończy się pełną niedostępnością usługi.
Poczta: gdzie zaczynają się realne problemy
Przy poczcie warto monitorować nie tylko sam port usługi, ale też rzeczy, które szybko przekładają się na kłopoty operacyjne:
- kolejki i opóźnienia,
- odrzucenia i błędy po stronie MTA,
- miejsce na dysku i inode’y,
- stan certyfikatów,
- próby nadużyć i nietypowe logowania,
- reputacyjne objawy spamu lub błędnych konfiguracji.
W dobrze utrzymanym środowisku poczta nie powinna zaskakiwać. Jeżeli zaskakuje, to zwykle znaczy, że wcześniej brakowało widoczności.
DNS: fundament, o którym przypomina się za późno
DNS bywa niewidoczny do momentu problemu, a wtedy okazuje się krytyczny dla całego środowiska. Warto pilnować:
- poprawności odpowiedzi dla kluczowych rekordów,
- czasu odpowiedzi,
- ważności stref i zmian,
- spójności po zmianach migracyjnych,
- stanu serwerów autorytatywnych,
- widoczności problemów z łącznością lub wygasaniem usług zależnych.
Co łączy te trzy obszary
WWW, poczta i DNS wymagają tego samego podejścia: monitoringu z perspektywy usługi, a nie tylko hosta. To oznacza połączenie:
- testów dostępności,
- monitoringu zasobów,
- obserwacji certyfikatów,
- analizy logów,
- prostego alertingu z priorytetem,
- warstwy bezpieczeństwa dla usług publicznych.
W praktyce najlepiej działa to wtedy, gdy monitoring infrastruktury jest połączony z hardeningiem usług publicznych oraz z monitoringiem infrastruktury IT.
Krótka lista kontrolna
Jeżeli chcesz szybko ocenić stan usług publicznych, sprawdź:
- czy monitoring obejmuje realną dostępność z punktu widzenia użytkownika,
- czy ktoś śledzi certyfikaty i ich terminy,
- czy kolejki, logi i błędy mają sensowny alerting,
- czy po zmianach w DNS i WWW wykonywana jest kontrola działania,
- czy usługi publiczne są także objęte warstwą bezpieczeństwa.
Podsumowanie
WWW, poczta i DNS to nie tylko „działające porty”. To usługi, które wymagają przewidywalnego nadzoru, bo drobne objawy bardzo często pojawiają się zanim dojdzie do awarii widocznej dla użytkownika. Dobrze zorganizowany monitoring i porządek w utrzymaniu pozwalają te sygnały zobaczyć wcześniej.
Powiązane artykuły
Jeżeli chcesz ograniczyć szum alertowy i skupić się na sygnałach, które naprawdę mają znaczenie, zobacz też artykuł Monitoring infrastruktury IT bez szumu.