Phase 7 · 회고와 제안서¶
예상 소요 1시간 · 난이도 ⭐⭐
스토리¶
15시간의 여정이 끝나갑니다. 회의실 화이트보드에는 Phase 1에서 처음 그렸던 장애 전파 다이어그램이 지저분하게 남아있습니다. CTO가 들어옵니다.
CTO
"두 주 동안 고생 많았습니다. 이제 진짜 질문을 드립니다. 앞으로 어떻게 할 건가요? 3분 피치로 설명해주세요."
이 Phase는 기술을 코드로 보여주는 것이 아니라, 판단으로 보여주는 시간입니다.
핵심 활동¶
- 의사결정 매트릭스 작성 (30분)
- 팀별 제안서 발표 (30분)
의사결정 매트릭스¶
각 팀은 3개의 의사결정을 내려야 합니다.
의사결정 1 — 플랫폼: ACA vs AKS¶
| 기준 | ACA | AKS |
|---|---|---|
| 운영 복잡도 | 낮음 | 높음 |
| 배포 자유도 | 제한적 | 자유 (ArgoCD 등) |
| 비용 구조 | 사용량 기반 | 노드 기반 (+ LB/스토리지) |
| 팀 역량 요구 | 낮음 | 중~상 |
| 우리 팀 현재 상태 | 1년 운영 경험 | 2주 체험 |
| 최종 추천 | ? | ? |
답이 하나가 아닙니다
"둘 다 쓴다"(Hybrid), "지금은 ACA 유지하고 차차 AKS로 넘어간다"(Migrate), "완전히 AKS로 간다"(Full Transition) 모두 정답일 수 있습니다. 근거가 중요합니다.
의사결정 2 — Retry + Circuit Breaker 적용 범위¶
- 모든 외부 호출에 적용?
- 결제 API 호출에만?
- 적용하지 않는 경우는 어떤 경우?
의사결정 3 — Agent 도입 여부 및 로드맵¶
| 옵션 | 설명 | 권장 시점 |
|---|---|---|
| 도입 안 함 | 현재 운영 규모에 오버킬 | — |
| 읽기 전용 Agent만 | 로그/메트릭 요약만 제공, 실행 권한 없음 | 지금 도입 가능 |
| 제한된 실행 권한 | 사전 승인된 명령(재시작 등)만 실행 가능 | 6개월 뒤 검토 |
| 완전 자동 운영 | Agent가 장애 감지부터 복구까지 자율 | 현재 단계에서는 부적절 |
팀별 제안서 발표¶
포맷¶
- 3분 피치 (팀당)
- 슬라이드 3장 이내
- 반드시 포함할 내용:
- 이번 분기에 무엇을 배웠나 (1줄)
- 세 가지 의사결정과 그 근거
- 다음 분기에 팀이 할 일 Top 3
평가 항목¶
| 항목 | 배점 |
|---|---|
| 기술적 정확성 | 25% |
| 의사결정의 근거 | 35% |
| 한밭푸드 맥락 반영 | 20% |
| 발표 명료성 | 20% |
개인 회고 (과제)¶
다음 질문에 대한 짧은 답변을 제출합니다 (200~400자).
- 이번 15시간 중 가장 인상 깊었던 순간은?
- 가장 어려웠던 개념은 무엇이고, 어떻게 극복했나?
- 실제 업무에 바로 적용할 수 있는 것 하나를 고른다면?
과정 수료 체크리스트¶
여러분이 이번 모듈을 완료했다고 말할 수 있으려면:
- 장애 전파 개념을 3줄로 설명할 수 있다
- Retry와 Circuit Breaker를 코드로 적용해본 경험이 있다
- 본인의 GitHub 레포에서
git push로 AKS까지 자동 배포가 동작한다 - Agent와 LLM의 차이를 예시로 설명할 수 있다
- Multi-Agent 설계 패턴 3개 중 하나로 실제 구현 경험이 있다
- 팀 제안서를 제출했다