IncidentManagement
IncidentManagement
DevOps ์ธ์๋ํธ ๋ถ๋ฅ ๋ฐ ๋ฐ๋ถ ์คํ ์์ด์ ํธ
์ธ์๋ํธ ์์ด์ ํธ๋ ์กฐ์ง์ ๊ด์ธก์ฑ ์คํ์์ ๊ฒฝ๊ณ ๋ฐ ํ ๋ ๋ฉํธ๋ฆฌ(์: ์งํ(Prometheus, Datadog), ๋ก๊ทธ(Splunk, ELK), ํธ๋ ์ด์ค(Jaeger, Grafana) ๋ฐ ๋ณด์ ์ด๋ฒคํธ)๋ฅผ ์์งํ๋ ๊ฒ์ผ๋ก ์์ํฉ๋๋ค. ์์ง๋์ด๋ค์๊ฒ ์์ ๊ฒฝ๊ณ ๋ฅผ ์์๋ถ๋...
IncidentManagement
IncidentManagement๋ ์์คํ ์ฅ์ ๋ ์๋น์ค ์ค๋จ ๊ฐ์ ์ฌ๊ฑด์ด ๋ฐ์ํ์ ๋ ์ด๋ฅผ ์ ์ํ ๋ฐ๊ฒฌํ๊ณ ๋์ํด ์ ์ ์ํ๋ก ๋ณต๊ตฌํ๋ ์ ์ฒด ๊ณผ์ ์ ๋ปํฉ๋๋ค. ํต์ฌ ๋จ๊ณ๋ ๊ฐ์ง, ์ฐ์ ์์ ๊ฒฐ์ , ๋์, ์ํ, ์์ธ ๋ถ์, ๊ทธ๋ฆฌ๊ณ ์ฌ๋ฐ ๋ฐฉ์ง๋ฅผ ์ํ ์กฐ์น์ ๋๋ค. ์ข์ ์ ์ฐจ์ ์ญํ ๋ถ๋ด, ์คํ ๊ฐ๋ฅํ ์คํ ์ง์นจ(๋ฐ๋ถ)์ด ์์ผ๋ฉด ๋์ ์๋์ ์ผ๊ด์ฑ์ด ํฌ๊ฒ ํฅ์๋ฉ๋๋ค. ์๋ํ์ ๋ชจ๋ํฐ๋ง ๋๊ตฌ๋ ๋ฌธ์ ๋ฅผ ๋น ๋ฅด๊ฒ ์๋ณํ๊ณ ์ด๊ธฐ ๋์์ ์ด์งํ๋ฉฐ, ์๋ฆผ ์ฒด๊ณ์ ๊ต๋ ๊ทผ๋ฌด(์จ์ฝ) ์ฒด๊ณ๋ ์ฌ๋์ด ์ ๋ ๊ฐ์ ํ ์ ์๊ฒ ํฉ๋๋ค. ๋์ ์ฑ๊ณผ๋ ํ๊ท ๋ณต๊ตฌ ์๊ฐ(MTTR), ํ์ง ์๊ฐ(MTTD) ๊ฐ์ ์งํ๋ก ์ธก์ ํด ๊ฐ์ ํจ๊ณผ๋ฅผ ํ์ธํฉ๋๋ค. ์ฌ๊ฑด ์ดํ์๋ ์ฌํ ๋ถ์(ํฌ์คํธ๋ชจํ )์ ํตํด ๊ทผ๋ณธ ์์ธ์ ํ์ ํ๊ณ ๋ฌธ์ํํด ๊ฐ์ ๋ฌธ์ ๊ฐ ๋ฐ๋ณต๋์ง ์๋๋ก ํฉ๋๋ค. ์กฐ์ง ์ ์ฒด์ ์์ ์ฑ๊ณผ ๊ณ ๊ฐ ์ ๋ขฐ๋ฅผ ์งํค๋ ค๋ฉด ์ฌ์ ์ค๋น, ๋ช ํํ ์ปค๋ฎค๋์ผ์ด์ , ์ง์์ ๊ฐ์ ์ด ํ์์ ๋๋ค. ๋ฐ๋ผ์ IncidentManagement๋ ๋จ์ํ ๋ฌธ์ ํด๊ฒฐ์ ๋์ด ์๋น์ค ํ์ง๊ณผ ๋น์ฆ๋์ค ์ฐ์์ฑ์ ํ๋ณดํ๋ ํต์ฌ ํ๋์ ๋๋ค.