2026-06-19

Codex Record & Replay가 의미하는 것: 반복 업무를 보여주고 Skill로 남기는 시대

OpenAI Codex의 Record & Replay 데모 영상을 바탕으로, 반복 워크플로를 녹화해 재사용 가능한 Skill로 바꾸는 기능이 개발자와 지식 작업자에게 어떤 의미인지 해석합니다.

OpenAI 개발자 영상에서 Nick Baumann은 Codex의 Record & Replay를 이렇게 보여준다. YouTube 영상을 게시하는 반복 업무를 사람이 한 번 수행한다. Codex는 그 화면, 클릭, 입력, 파일 선택, 검증 과정을 관찰한다. 그리고 다음부터 재사용할 수 있는 SKILL.md 형태의 Skill을 만든다.

겉으로 보면 화면 녹화 기반 자동화 데모처럼 보인다. 하지만 의미는 그보다 크다. 이 기능은 “프롬프트를 잘 써서 AI에게 설명하는 방식”에서 “내가 실제로 하는 방법을 보여주고, 그 절차를 검토 가능한 운영 지식으로 남기는 방식”으로 이동한다는 신호다.

영상 링크: Codex Record & Replay 데모

영상의 핵심 장면

영상 속 예시는 YouTube 업로드 업무다. 팀은 새 영상을 올릴 때마다 비슷한 일을 반복한다.

게시 스프레드시트에서 제목과 설명 같은 메타데이터를 찾는다.
업로드 패키지에서 영상 파일, 썸네일, 영어 자막을 찾는다.
YouTube Studio에서 필드와 설정을 순서대로 채운다.
영상을 private 상태로 저장한다.
저장된 값이 맞는지 확인한다.

사람에게는 단순하지만 지루한 일이다. 한 번 빠뜨리면 영상 설명이 틀리거나, 자막이 빠지거나, 공개 상태가 의도와 다르게 될 수 있다. 이 지점에서 Record & Replay는 “반복 절차를 말로 설명하지 말고 한 번 보여달라”고 제안한다.

Codex는 녹화가 끝난 뒤 그 절차를 Skill로 만든다. 공식 문서 기준으로 이 Skill은 언제 써야 하는지, 어떤 입력이 필요한지, 어떤 단계를 따라야 하는지, 결과를 어떻게 검증해야 하는지를 담는다. 사용자는 생성된 Skill을 그대로 쓰지 않고, 선호사항이나 예외 처리를 추가해 더 튼튼하게 다듬을 수 있다.

이것은 단순한 매크로가 아니다

Record & Replay를 브라우저 매크로처럼 이해하면 절반만 본 것이다. 핵심은 “클릭 좌표를 저장한다”가 아니라 “반복 업무의 의도와 검증 기준을 Skill로 만든다”에 있다.

전통적인 매크로는 보통 이런 식이다.

이 버튼 클릭
이 필드에 입력
다음 버튼 클릭
저장 클릭

반면 Skill은 조금 다른 층위의 운영 지식이다.

언제 이 업무를 실행해야 하는가
매번 달라지는 입력은 무엇인가
팀의 기본 선호사항은 무엇인가
반드시 확인해야 할 성공 기준은 무엇인가
실패하면 어디서 멈추고 사람에게 물어야 하는가

따라서 이 기능의 진짜 가치는 “자동 클릭”보다 절차기억의 문서화에 있다. 사람이 하던 반복 작업이 실행 가능한 지침으로 바뀌고, 그 지침은 수정, 검토, 재사용할 수 있다.

프롬프트에서 시연으로

지금까지 AI에게 일을 맡기는 기본 방식은 설명이었다.

1
2
3

이 파일을 보고, 스프레드시트에서 제목을 찾고,
YouTube Studio에 들어가서 제목과 설명을 채우고,
썸네일과 자막을 붙인 뒤 private으로 저장해줘.

이 방식은 두 가지 문제가 있다.

첫째, 설명이 길어진다. 사람이 당연하게 여기는 순서, 파일명 관례, 클릭 위치, 검증 습관까지 모두 말로 적어야 한다.

둘째, 선호사항이 빠진다. “우리 팀은 항상 private으로 저장한다”, “자막은 영어 파일을 먼저 붙인다”, “스프레드시트의 특정 열을 기준으로 매칭한다” 같은 지식은 문서화되지 않은 채 사람의 손에 남아 있기 쉽다.

Record & Replay는 이 문제를 뒤집는다. 사용자가 먼저 시연하고, Codex가 절차를 초안화한다. 이후 사람은 초안을 검토하고 다듬는다. 즉, 프롬프트 작성의 일부가 업무 시연과 Skill 편집으로 바뀐다.

Skill은 지식 작업자의 런북이다

OpenAI의 Codex Skills 문서에 따르면 Skill은 SKILL.md를 중심으로 한 디렉터리이며, 필요하면 scripts/, references/, assets/를 함께 둘 수 있다. Codex는 처음부터 모든 Skill 본문을 읽는 것이 아니라, 이름과 description 같은 메타데이터를 보고 필요한 Skill을 선택한 뒤 본문을 읽는다.

이 구조는 중요한 운영 모델을 만든다.

구분	의미
`description`	언제 이 Skill을 써야 하는지 알려주는 라우팅 신호
`SKILL.md`	실제 절차, 판단 기준, 검증 방법
`scripts/`	반복적이고 결정적인 실행 로직
`references/`	필요할 때만 읽을 보조 지식
`assets/`	템플릿, 예시, 양식

Record & Replay는 이 Skill을 사람이 처음부터 쓰지 않아도 되게 만든다. 잘 아는 업무를 수행하면 Codex가 초안을 만들고, 사람은 그 초안에 빠진 선호사항과 경계 조건을 추가한다.

이것은 “문서 작성 자동화”가 아니라 “런북 작성 자동화”에 가깝다.

어떤 업무에 잘 맞는가

공식 문서의 기준은 명확하다. Record & Replay는 반복적이고, 선호사항이 중요하며, 프롬프트로 설명하는 것보다 보여주는 편이 쉬운 업무에 적합하다. 또한 단계가 안정적이고 성공 기준이 분명할수록 잘 작동한다.

잘 맞는 예시는 이런 것들이다.

YouTube 영상 업로드와 검증
비용 보고서 제출
휴가 요청 등록
반복 보고서 다운로드
이슈를 특정 양식에 맞춰 생성
블로그 글 발행 전 체크리스트 수행
PR 설명 작성과 공유
캘린더 초대 생성

반대로 아래와 같은 업무에는 조심해야 한다.

매번 판단 기준이 크게 바뀌는 업무
비밀번호, API 키, 고객 개인정보가 화면에 노출되는 업무
실패했을 때 되돌리기 어려운 실행 업무
성공 기준이 불분명한 업무
팀 전체에 배포해야 하는 안정적인 제품형 자동화

마지막 경우에는 Record & Replay로 빠르게 Skill 초안을 만든 뒤, 별도 plugin이나 MCP 서버, 스크립트로 승격하는 편이 낫다. OpenAI 문서도 팀 배포, 앱 통합, MCP 서버, 설치 메타데이터가 필요한 경우에는 plugin 패키징을 고려하라고 설명한다.

우리 블로그 운영에 적용하면

이 영상을 보면서 바로 떠오르는 것은 YouTube가 아니라 이 블로그의 운영 흐름이다. 이미 Knot과 GitHub Pages 블로그를 연결했고, Blog Ops 화면에서 초안 목록과 게시 상태를 확인하고 있다.

우리에게 Record & Replay형 Skill이 유용한 지점은 이런 업무다.

Obsidian 원고 확인
frontmatter 보강
카테고리와 태그 정리
썸네일 생성 또는 연결
본문 이미지 경로 변환
Hexo 빌드
공개 URL 확인
GA4 실시간 확인
댓글 영역 확인
커밋과 배포

이 과정을 매번 프롬프트로 길게 설명하는 대신, 한 번 잘 수행한 과정을 Skill로 남기면 된다. 그러면 다음에는 “이 원고를 블로그 게시 준비하고 배포해줘”라는 요청만으로도 Codex가 어느 정도 같은 흐름을 재현할 수 있다.

중요한 점은 모든 것을 완전 자동화하자는 뜻이 아니라는 것이다. 발행 버튼처럼 공개 상태를 바꾸는 작업은 여전히 최종 승인 게이트가 필요하다. 하지만 검토 전 단계, 즉 원고 정리, 이미지 복사, 빌드, 링크 확인, GA4 확인 같은 반복 작업은 Skill로 만들 가치가 크다.

왜 지금 중요한가

Record & Replay는 Codex가 “답변하는 도구”에서 “업무 절차를 학습하고 재실행하는 작업 환경”으로 이동하고 있음을 보여준다.

이 변화에는 세 가지 함의가 있다.

첫째, 개인의 암묵지가 파일로 바뀐다.

지금까지 많은 업무 노하우는 “그 사람이 늘 하던 방식”으로만 존재했다. Record & Replay는 그 방식을 SKILL.md 같은 검토 가능한 산출물로 바꾼다.

둘째, 자동화의 진입 장벽이 낮아진다.

스크립트를 짜기 전에 먼저 보여줄 수 있다. 완벽한 자동화를 설계하지 못해도, 반복 업무를 Skill 초안으로 시작할 수 있다.

셋째, 검증의 중요성이 더 커진다.

한 번 녹화한 절차가 반복 실행되기 때문에, 잘못된 습관도 그대로 자동화될 수 있다. 그래서 Skill에는 “어떻게 하는가”뿐 아니라 “언제 멈춰야 하는가”, “무엇을 확인해야 성공인가”가 들어가야 한다.

Skill을 만들 때 남겨야 할 것

Record & Replay로 만든 Skill은 초안이다. 그대로 신뢰하기보다 아래 항목을 꼭 보강해야 한다.

[ ] 이 Skill이 언제 트리거되어야 하는가
[ ] 이 Skill이 절대 트리거되면 안 되는 상황은 무엇인가
[ ] 매번 달라지는 입력은 무엇인가
[ ] 민감정보를 다루는 단계가 있는가
[ ] 실패하면 어디서 중단해야 하는가
[ ] 결과를 어떻게 검증할 것인가
[ ] 사람이 최종 승인해야 하는 단계는 무엇인가

특히 description은 중요하다. Codex는 Skill 목록에서 description을 보고 어떤 Skill을 선택할지 판단한다. “YouTube 작업을 돕는다”보다 “새 영상 업로드 패키지와 게시 스프레드시트를 받아 YouTube Studio에 private 영상 초안을 만들고 저장 상태를 검증한다”가 훨씬 낫다.

결론

이 영상의 메시지는 “Codex가 YouTube 업로드를 대신한다”가 아니다. 더 넓게 보면, 반복 가능한 지식 작업을 보여주고, 그것을 검토 가능한 Skill로 바꾸고, 다음부터 재사용한다는 흐름을 보여준다.

앞으로 중요한 능력은 프롬프트를 길게 쓰는 능력만이 아니다. 좋은 업무 시연을 하고, 생성된 Skill을 읽고, description과 검증 단계를 다듬고, 위험한 단계에는 사람 승인 게이트를 두는 능력이 중요해진다.

Codex Record & Replay는 반복 업무를 없애는 기능이라기보다, 반복 업무를 조직의 절차기억으로 바꾸는 기능에 가깝다. 그것이 이 짧은 2분짜리 데모가 가진 진짜 의미다.

AI agent 실습과 학습 노트를 운영 가능한 기록으로 남깁니다.

Codex Record & Replay가 의미하는 것: 반복 업무를 보여주고 Skill로 남기는 시대

영상의 핵심 장면

이것은 단순한 매크로가 아니다

프롬프트에서 시연으로

Skill은 지식 작업자의 런북이다

어떤 업무에 잘 맞는가

우리 블로그 운영에 적용하면

왜 지금 중요한가

Skill을 만들 때 남겨야 할 것

결론

참고 자료

댓글

영상의 핵심 장면

이것은 단순한 매크로가 아니다

프롬프트에서 시연으로

Skill은 지식 작업자의 런북이다

어떤 업무에 잘 맞는가

우리 블로그 운영에 적용하면

왜 지금 중요한가

Skill을 만들 때 남겨야 할 것

결론

참고 자료

더 읽어보기

댓글