WWW, poczta i DNS przed awarią

Usługi publiczne rzadko przestają działać całkowicie bez żadnego sygnału ostrzegawczego. Zwykle wcześniej pojawia się kilka objawów: wydłużony czas odpowiedzi, problemy z certyfikatem, wzrost kolejek, błędy DNS, brak miejsca na dysku albo niepokojące wpisy w logach. Problem polega na tym, że bez sensownego monitoringu te sygnały pozostają niewidoczne aż do momentu, gdy zgłasza je klient albo użytkownik.

WWW: co warto obserwować oprócz statusu 200

Sama odpowiedź HTTP nie zawsze mówi, że strona działa poprawnie. W praktyce warto pilnować także:

czasu odpowiedzi,
ważności certyfikatu,
błędów 5xx,
dostępności endpointów krytycznych,
miejsca na dysku dla logów i cache,
procesów aplikacyjnych i workerów,
zależności od bazy i reverse proxy.

Dzięki temu łatwiej zauważyć degradację, zanim skończy się pełną niedostępnością usługi.

Poczta: gdzie zaczynają się realne problemy

Przy poczcie warto monitorować nie tylko sam port usługi, ale też rzeczy, które szybko przekładają się na kłopoty operacyjne:

kolejki i opóźnienia,
odrzucenia i błędy po stronie MTA,
miejsce na dysku i inode’y,
stan certyfikatów,
próby nadużyć i nietypowe logowania,
reputacyjne objawy spamu lub błędnych konfiguracji.

W dobrze utrzymanym środowisku poczta nie powinna zaskakiwać. Jeżeli zaskakuje, to zwykle znaczy, że wcześniej brakowało widoczności.

DNS: fundament, o którym przypomina się za późno

DNS bywa niewidoczny do momentu problemu, a wtedy okazuje się krytyczny dla całego środowiska. Warto pilnować:

poprawności odpowiedzi dla kluczowych rekordów,
czasu odpowiedzi,
ważności stref i zmian,
spójności po zmianach migracyjnych,
stanu serwerów autorytatywnych,
widoczności problemów z łącznością lub wygasaniem usług zależnych.

Co łączy te trzy obszary

WWW, poczta i DNS wymagają tego samego podejścia: monitoringu z perspektywy usługi, a nie tylko hosta. To oznacza połączenie:

testów dostępności,
monitoringu zasobów,
obserwacji certyfikatów,
analizy logów,
prostego alertingu z priorytetem,
warstwy bezpieczeństwa dla usług publicznych.

W praktyce najlepiej działa to wtedy, gdy monitoring infrastruktury jest połączony z hardeningiem usług publicznych oraz z monitoringiem infrastruktury IT.

Krótka lista kontrolna

Jeżeli chcesz szybko ocenić stan usług publicznych, sprawdź:

czy monitoring obejmuje realną dostępność z punktu widzenia użytkownika,
czy ktoś śledzi certyfikaty i ich terminy,
czy kolejki, logi i błędy mają sensowny alerting,
czy po zmianach w DNS i WWW wykonywana jest kontrola działania,
czy usługi publiczne są także objęte warstwą bezpieczeństwa.

Podsumowanie

WWW, poczta i DNS to nie tylko „działające porty”. To usługi, które wymagają przewidywalnego nadzoru, bo drobne objawy bardzo często pojawiają się zanim dojdzie do awarii widocznej dla użytkownika. Dobrze zorganizowany monitoring i porządek w utrzymaniu pozwalają te sygnały zobaczyć wcześniej.

Powiązane artykuły

Jeżeli chcesz ograniczyć szum alertowy i skupić się na sygnałach, które naprawdę mają znaczenie, zobacz też artykuł Monitoring infrastruktury IT bez szumu.

WWW, poczta i DNS: co sprawdzać przed awarią

WWW: co warto obserwować oprócz statusu 200

Poczta: gdzie zaczynają się realne problemy

DNS: fundament, o którym przypomina się za późno

Co łączy te trzy obszary

Krótka lista kontrolna

Podsumowanie

Powiązane artykuły

Chcesz przełożyć temat artykułu na działania w środowisku?

Przejdź do usługi

WWW, poczta i DNS: co sprawdzać przed awarią

WWW: co warto obserwować oprócz statusu 200

Poczta: gdzie zaczynają się realne problemy

DNS: fundament, o którym przypomina się za późno

Co łączy te trzy obszary

Krótka lista kontrolna

Podsumowanie

Powiązane artykuły

Dalsza lektura i usługi, które najczęściej łączą się z tym tematem.

Artykuł: Linux w produkcji: aktualizacje bez chaosu

Artykuł: Jak czytać logi Linux przed alertem

Usługa: Monitoring infrastruktury IT

Usługa: Administracja serwerami Linux

Usługa: Bezpieczeństwo środowiska IT

Chcesz przełożyć temat artykułu na działania w środowisku?

Przejdź do usługi