영상으로 읽기: Claude Code Harness 심화 / 황민호 / 260527

카카오 황민호 수석의 강연을 통해 하네스 엔지니어링의 본질, 메타 하네스 설계, 그리고 클로드 코드의 에이전트 팀 수평 협업 메커니즘을 심층 분석합니다.

카카오 황민호 수석의 강연 세션 “Claude Code Harness 심화”를 요약하고 해석한 비디오 노트입니다. 단순한 명령 기반의 AI 활용을 넘어, 자율적으로 오랫동안 테스크를 수행하는 하네스 엔지니어링(Harness Engineering)의 실무적 구현과 최신 에이전트 협업 패러다임을 다룹니다.


1. Harness Engineering 개요 & FD 조직 소개

자막 근거 · 05:41

저는 현재 카카오 소속이고 그 FD 조직에 지금 몸 담고 있습니다. 이 FD라는 직군이 최근에 팔란티어를 시작으로 핫해지고 있는 직군이기도 한데요. 포워드 디플로이드 엔지니어(Forward Deployed Engineer)라고 해서 전방 배치의 엔지니어입니다.

해석

황민호 수석이 몸담고 있는 FD(Forward Deployed Engineer) 조직은 고객 최전선(카카오 내부에서는 사내 여러 조직들)에 전방 배치되어 비즈니스 병목을 진단하고, AI 기술과 솔루션을 결합해 극도로 빠른 속도로 실제 동작하는 시스템을 구축하는 역할을 수행합니다.

이러한 조직적 배경은 단순히 이론적인 AI 탐구에 그치지 않고, 현업의 워크플로우를 분석하여 자율적으로 일하는 시스템을 설계하는 하네스 엔지니어링의 패러다임과 직접 맞닿아 있습니다. 하네스는 사람의 상시적인 개입 없이도 AI가 복잡하고 긴 호흡의 태스크를 자율적이고 안정적으로 처리할 수 있도록 돕는 핵심 운영 환경을 뜻합니다.


2. AI에게 운전대를 넘기기 (AI-driven Automation)

자막 근거 · 10:44

시간이 지나서 돌이켜 보니 한 가지 문제가 있는 거 같았습니다. 왜냐면 운전대는 항상 제가 들고 있었거든요. 그래서 그 운전대를 잡고 있는 동안에만 생산성이 있었습니다. 그리고 그 운전대를 옆에서 AI는 보조 역할만 해 주고 있었죠. 그래서 운전대를 AI에게 맡겨보는 방식으로 바꾸기로 생각을 했고…

해석

기존의 생성형 AI 활용은 대화형 인터페이스(Chat UI)를 통해 인간이 일일이 명령을 내리고 확인하는 보조형(Copilot)에 머물렀습니다. 이 구조는 인간이 직접 개입하는 시간 동안만 생산성이 발생하는 인간 병목(Human Bottleneck)을 지닙니다.

하네스 엔지니어링은 ‘운전대를 AI에게 직접 넘겨주는 행위’입니다. 앤트로픽과 오픈AI 등의 실리콘밸리 빅테크 기업들은 수백만 라인에 달하는 거대한 코드베이스 개발 작업을 에이전트에게 통째로 일임하여 자율 완수하게 하는 등, 운전대를 완전히 넘겨받은 AI 에이전트의 자율 실행 사례를 지속적으로 증명해내고 있습니다. 이를 가능케 하려면 에이전트의 워크플로우 설계, 상태 추적, 자가 복구 루프를 지탱하는 탄탄한 운영 시스템(Harness) 구축이 전제되어야 합니다.


3. Meta Harness Skill 및 오픈소스 생태계

자막 근거 · 17:21

이 하네스를 구성해 주는 메타 하네스 스킬을 별도로 개발을 했습니다. 그래서 여기서는 어떤 목표를 정해 주면 이 목표를 수행하기 위한 하네스 구성을 해 줍니다. 그리고 그 구성된 에이전트들로 동작을 시켜서 최종 결과물을 만드는 그런 작업에 사용하고 있습니다.

해석

에이전트와 도구, 품질 검증 로직을 하나씩 수동으로 연결하여 하네스를 구성하는 작업은 개발자에게 큰 공수가 듭니다. 황민호 수석은 목표나 의도(Intent)만 던져주면 필요한 하네스의 설계와 에이전트 구성을 AI가 자율적으로 기획 및 셋업하도록 지원하는 ‘메타 하네스 스킬(Meta-Harness Skill)’을 직접 구현하여 깃허브 오픈소스로 배포했습니다.

이 오픈소스는 에이전트 활용의 기술적 진입 장벽을 낮추며 폭발적인 깃허브 스타와 사용자 후기를 이끌어냈습니다. 수동으로 오케스트레이션 로직을 작성하는 비효율을 걷어내고, ‘하네스를 빌드하는 하네스’의 추상화 레이어를 제공하여 복잡한 자율 코딩 환경의 조율을 극대화한 모범적 설계 패턴입니다.


4. 마켓플레이스를 통한 플러그인/스킬 설치

자막 근거 · 18:50

이 스킬을 설치하는 방법을 마켓플레이스라는 장치를 통해서 설치를 할 수가 있습니다. 그래서 이 마켓플레이스를 먼저 추가해야 되는데 이게 슬러시 플러그인 그리고 마켓플레이스 애드 레브 팩토리 슬러시 하네스 이렇게 하면 마켓플레이스를 추가할 수가 있습니다.

해석

앤트로픽의 터미널 기반 개발 도구인 클로드 코드(Claude Code)에서 플러그인 마켓플레이스를 활용하여 스킬을 로드하고 제어하는 실전적인 방법론입니다. CLI 상에서 /plugins 인터페이스 혹은 전용 명령어를 실행해 외부 플러그인을 프로젝트 전역(user scope)에 설치 및 리로드하여 에이전트가 사용할 수 있는 스킬셋을 동적으로 바인딩합니다.

특히 AI에게 명령을 내릴 때, 선언형(Declarative) 제어 방식을 취합니다. 즉, “보고서를 작성하라”는 단순 1차원 명령 대신 “~한 보고서를 작성하고자 합니다”라는 최종적인 의도를 던지면, 하네스가 이 의도에 부합하는 서브 에이전트 팀을 자율 기획하고 설계하여 작동시키는 진보된 태스크 해결 과정을 구현합니다.


5. Harness 주방 비유와 품질 피드백 루프

자막 근거 · 1:00:20

우리가 주방에서 한 명의 셰프를 둔다고 가정해 보겠습니다. 그러면 이 한 명이 주문, 조리, 검수, 그리고 심지어 설거지까지도 할 수 있을 것 같아요. … 근데 주문이 몰려들고 손님이 많아지면 병목이 생기겠죠. … 반면에 멀티에이전트 즉 여러 역할을 가진 에이전트들이 동작을 해 본다고 가정해 보겠습니다. 그러면 주문, 준비, 조리, 검수 각각의 역할로 분리되어 있는 에이전트들이 동작을 하는 거죠.

해석

하네스 엔지니어링의 정수를 직관적인 ‘주방(Kitchen)과 셰프’의 관계에 비유해 설명합니다. 단일 에이전트(1인 셰프)는 작고 단순한 작업을 할 때는 경제적이고 빠르지만, 일이 고도화되고 복잡해질수록 컨텍스트 오버플로우와 피로 누적으로 인한 에러가 급증하게 됩니다.

반면, 멀티 에이전트(역할 분할 주방) 체제는 주문(PM/오케스트레이터), 준비(데이터 수집), 조리(코드/콘텐츠 생성), 검수(QA/테스팅) 등으로 역할을 명확히 쪼갭니다. 각 에이전트는 독립된 작업대(Bounded Context)를 활용하여 잡음(Noise) 없이 고유 역할에 몰입하며, 중간 산출물 및 테스트 기반 피드백 루프를 거치며 최종 품질을 점진적으로 깎아 나갑니다. 초기 구축 공수와 토큰 비용은 단일 에이전트에 비해 늘어나지만, 높은 완성도와 자율 유지 능력을 확보할 수 있는 지향점입니다.


6. 에이전트 팀 수평 협업 활성화

자막 근거 · 1:04:33

세팅스 제이슨(settings.json) 파일이 있습니다. … 여기에 환경 변수로 클로드 코드, 익스프라이먼트, 에이전트 팀(agentTeam) 이거를 1로 활성화해 놓은 걸 볼 수 있습니다. … 분석을 하다가 리서치가 좀 부족한 부분을 발견합니다. 그러면 얘가 리서치를 하는 게 아니라 리서치 에이전트를 다시 깨웁니다.

해석

기존의 에이전트 구동 방식은 부모 에이전트가 자식 에이전트를 일방적으로 호출하고 결과를 넘겨받은 뒤 자식이 소멸하는 엄격한 탑다운(Top-down) 격리 실행 구조였습니다. 하지만 클로드 코드의 실험적 기능인 agentTeam을 활성화하고 안티그래비티(Antigravity) CLI 등의 최신 도구 체인을 도입하면, 에이전트들 간의 수평적 P2P(Peer-to-Peer) 협업이 가동됩니다.

분석 에이전트가 작업을 진행하다 리서치 데이터에 구멍이 난 것을 인지하면, 자신이 직접 부족한 부분을 메우기 위해 컨텍스트를 어지럽히는 대신, 이미 실행을 마치고 대기 상태에 있던 리서치 에이전트를 동적으로 다시 깨워(Dynamic Wake-up) 추가 보완 조사를 요청합니다. 에이전트들이 서로의 전문성을 상호 인지하고 메시지를 주받으며 협동하는 자율 협업의 정점입니다.


내 생각

카카오 황민호 수석의 강연이 전하는 메시지는 필자가 본 블로그에서 꾸준히 강조해오던 에이전틱 엔지니어링 철학과 완벽히 궤를 같이합니다.

첫째, “AI의 작업대(Context Desk)는 언제나 깔끔하게 정돈되어 있어야 한다”는 점입니다. 주방 작업대가 엉망이면 소금 대신 설탕을 넣는 참사가 나듯, 에이전트의 대화 히스토리가 과대해지거나 불필요한 파일이 컨텍스트에 섞여 들어가면 환각(Hallucination)과 연산 오류가 빈번해집니다. 이를 예방하기 위해 우리는 터미널 상에서 /compact/clear를 기계적으로 입력하며 컨텍스트 경계를 보존해야 합니다.

둘째, 수평적 에이전트 협업(agentTeam)이 여는 새로운 구도입니다. 오케스트레이터가 모든 흐름을 제어하는 성당형 모델(Cathedral Model)에서 탈피하여, 에이전트들이 독립된 컨텍스트 영역(Bounded Context)을 갖고 필요할 때 동적으로 서로를 호출하고 깨우는 시장형 모델(Bazaar Model)로의 전환은 복잡한 다단계 실무 작업을 처리하는 가장 탄탄한 열쇠가 될 것입니다.

결국 미래의 개발이란 에이전트가 자율 주행을 할 수 있도록 완벽한 안전장치, 정교한 워크플로우 설계, 그리고 투명한 품질 피드백 루프를 아우르는 ‘고성능 말고삐(Harness)’를 조각해내는 일이 될 것입니다. 운전대를 AI에게 완전히 넘기는 패러다임 전환은 이미 눈앞에 와 있습니다.

Comments

댓글

GitHub 계정으로 의견을 남길 수 있습니다. 댓글은 GitHub Discussions에 저장됩니다.