관측성

프로덕션 ML 모니터링 부트캠프

운영 중인 모델의 품질을 “보이게” 만드는 모니터링 패턴을 처음부터 끝까지 구현합니다.

4주 · 주 2회 저녁 · 총 24시간 중급 온라인 라이브 실습 65%

이 트랙이 다루는 범위

관측성 클리닉이 “이상을 감지하는 구조”에 집중한다면, 이 부트캠프는 “운영 중 모델 품질을 매일 확인하는 흐름”을 처음부터 만들어 봅니다. 4주 동안 입력·출력 분포, 라벨 도착 지연, 사용자 피드백, 비즈니스 지표를 같은 보드로 묶고, 매일 아침 5분이면 상태를 파악할 수 있는 운영 화면을 완성합니다.

포함된 학습 요소

  • 데일리 모니터링 보드 설계
  • 라벨 지연 시나리오 분기 처리
  • 비즈니스 지표와 모델 지표 연결
  • 드리프트 알람 룰 캘리브레이션
  • 온콜 체크리스트 자동화
  • 사례 기반 회고 워크숍 2회

이 트랙을 마친 사람이 할 수 있게 되는 것

  • 모델 품질 상태를 매일 5분 안에 파악할 수 있다
  • 드리프트 알람의 거짓 양성을 정량적으로 줄일 수 있다
  • 비즈니스 KPI와 연결된 운영 리포트를 만들 수 있다

책임 코치

최지원 프로필

최지원

관측성 도구를 한 회사에서 4년간 운영한 SRE.

자주 묻는 질문

드리프트 감지 알고리즘을 깊게 다루나요?
아주 깊지는 않습니다. 운영 가능한 수준의 두세 가지 방법을 비교하고, 거짓 양성을 어떻게 조정하는지에 더 시간을 씁니다.
대시보드 도구는 무엇을 쓰나요?
Grafana를 중심으로 진행합니다. 다만 패턴 자체는 다른 대시보드 도구로도 재현 가능하도록 설계되어 있습니다.
비즈니스 KPI 데이터를 가져올 수 있는 환경이 없으면 어떻게 하나요?
실습용 가상 KPI 데이터셋을 제공합니다. 다만 본인 환경에 적용하려면 사내 데이터팀과 사전 협의를 권장합니다.

참가자 후기

“모니터링 보드가 “지표 모음”에서 “하루 5분 점검표”로 바뀐 게 가장 큰 변화였습니다. 다만 데이터 연결 부분은 회사 사정에 따라 시간이 더 필요했습니다.”

문하늘 · SRE ★★★★☆