Hoiatuste korrelatsioon
Hoiatuste korrelatsioon
DevOpsi intsidentide triaaži ja runbookide täitmise agendid
Intsidentide agendid alustavad hoiatuste ja telemeetria vastuvõtmisega organisatsiooni jälgitavuse korstnast – nt. mõõdikud (Prometheus, Datadog),...
Hoiatuste korrelatsioon
Hoiatuste korrelatsioon tähendab süsteemi poolt sarnaste või samast probleemist pärinevate teadete grupeerimist nii, et need käsitletakse kui üks sündmus. Selle abil vähendatakse mürataset ja välditakse sama probleemi kohta saadetavate korduvate teadete üleküllust. Korrelatsioon võib põhineda ajalisel kattumisel, samal teenusel, samal masinal või komponentide vahelistel sõltuvustel. See võimaldab kiiremini tuvastada juurpõhjust, sest operaator näeb kõike seotud teadetest ühe pilguga. Mõnikord kasutatakse selleks lihtsaid reegleid, vahel ka masinõpet, mis õpib ära mustrid ja grupib teadete rühmadeks. Oluline on häälestada korrelatsiooni õigesti, sest vale rühmitamine võib peita tõelisi probleeme või tekitada valesid rahulikkuse tundeid. Korrelatsioon aitab meeskondadel keskenduda olulisele ja vähendab tühjade reageeringute arvu. See pärsib häireväsimust ja parandab reageerimise kiirust, sest harvemini tuleb käsitsi üle vaadata palju üksikuid teadet. Lõplikud otsused peaksid siiski jääma inimesele, kes saab konteksti hinnata ja vajadusel eraldada juhtumid uuesti. Kui korrelatsioon on tehtud hästi, muutub sündmuste haldamine selgemaks ja süsteemi töökindlus paraneb.