Anthropic, "바이브 코드"의 새로운 방식을 공개하다

AAI LABS
Internet TechnologyComputing/Software

Transcript

00:00:00AI 에이전트의 가장 큰 문제는 컨텍스트 창이 제한적이라는 점입니다.
00:00:03이 때문에 이전 작업 내용을 제대로 기억하지 못합니다..
00:00:06Claude 코드에 큰 작업을 맡기면, 하나의 기능을 구현하는 과정에서 여러 번 컨텍스트를 압축하게 됩니다.
00:00:12이 때문에 원래 맡았던 주요 작업을 잊어버려 장기 작업에는 비효율적입니다..
00:00:17Anthropic은 실제 엔지니어링 환경에서 팀이 작업하는 방식에 착안한 해결책을 최근 발표했습니다.
00:00:22그들은 장기 작업에서 실패하는 두 가지 주요 원인을 찾아냈습니다.
00:00:26많은 분들이 전체 애플리케이션이나 큰 기능을 한 번에 구현하려 시도했지만,
00:00:30너무 많은 작업을 한꺼번에 처리하려다 모델의 컨텍스트가 고갈되는 경우가 많았습니다.
00:00:34반복적인 압축 후에는 컨텍스트 창이 새로고침되면서 기능이 절반만 구현된 상태로 남고,
00:00:39그 기능의 진행 상황에 대한 기억도 사라져 결국 불완전한 구현으로 이어집니다.
00:00:43두 번째 문제는 테스트 기능이 부족해서 Claude가 테스트되지 않은 기능을 완료된 것으로 표시한다는 점입니다.
00:00:49제대로 작동하지 않더라도 기능이 완료되었다고 가정해 버립니다.
00:00:53그들의 해결책은 실제 소프트웨어 팀의 작업 방식에서 영감을 받아,
00:00:56초기화 에이전트와 코딩 에이전트를 조화롭게 사용하는 것이었습니다.
00:00:59이 워크플로는 원래 직접 구축하는 에이전트를 위한 것이지만,
00:01:02Claude 코드 인스턴스에도 적용될 수 있다는 것을 알게 되었습니다.
00:01:06첫 번째 에이전트는 코딩 에이전트를 제대로 초기화하는 데 집중합니다.
00:01:09이 과정은 시간이 좀 걸리니 인내심을 가지셔야 합니다..
00:01:12저는 빈 Next.js 프로젝트가 있는데, 온라인 파이썬 컴파일러를 만들고 싶습니다.
00:01:16시작하기 전에 `init` 명령어를 사용해 `Claude.md` 파일을 생성하세요.
00:01:20이 파일은 코드베이스 문서로, 프로젝트 루트에 위치하며 전체 개요와 모든 중요한 정보를 담고 있습니다.
00:01:27다음으로, 프로젝트 루트에 기능 목록 JSON 파일을 생성합니다.
00:01:30이 파일에는 모든 기능과 해당 테스트 단계가 나열되어야 하며,
00:01:33모든 테스트는 초기에는 실패로 표시하여 Claude가 반드시 테스트하도록 강제합니다.
00:01:38JSON 파일이 컨텍스트 내에서 관리하기 더 쉽기 때문에 Markdown 대신 JSON을 사용합니다.
00:01:43Claude는 브라우저에 보이는 인터페이스가 아닌 코드만 테스트할 수 있으므로,
00:01:46브라우저 테스트를 위해 Puppeteer를 연결했습니다.
00:01:49그 다음,
00:01:49개발 서버 시작을 안내하는 초기화 스크립트와 시스템이 프로젝트 완료 상태를 추적할 수 있도록 진행 상황 추적 파일을 생성합니다.
00:01:57가이드라인에 따라 Claude는 매 실행 후 `progress.md`를 업데이트하고,
00:02:02기능 구현 후에는 각 기능을 테스트해야 합니다.
00:02:04가장 중요한 관행은 Git에 커밋하는 것입니다.
00:02:07병합 가능한 상태로 커밋하는 것이 얼마나 중요한지 우리는 과소평가하고 있습니다.
00:02:10명확한 로그가 있는 Git 커밋은 무엇이 완료되었는지 보여주고,
00:02:13구현이 실패했을 때 되돌릴 수 있게 해줍니다.
00:02:15마지막으로, Claude는 기능을 구현됨으로 표시하는 것 외에 기능 목록을 변경해서는 안 됩니다.
00:02:20환경이 준비되었으니 이제 코딩 단계로 넘어갑니다.
00:02:23아이디어는 기능 JSON에 있는 각 기능을 하나씩 구현하는 것이었습니다.
00:02:27Claude는 또한 테스트된 각 기능 후에 설명적인 커밋 메시지를 작성하고,
00:02:31필요할 때는 브라우저를 실행했습니다.
00:02:33앱이 작동하는 것을 확인하면,
00:02:34JSON 필드를 `false`에서 `true`로 업데이트하고,
00:02:38`progress.md`에 지금까지 완료된 내용을 업데이트했습니다.
00:02:42마지막으로 변경 사항을 커밋하고, 커밋이 성공했는지 확인했습니다.
00:02:45이 점진적인 접근 방식의 장점은 세션이 종료되더라도 중단했던 지점에서 정확히 다시 시작할 수 있다는 점입니다.
00:02:51모든 것이 Git 로그에 추적되므로 코드를 망가뜨릴 걱정을 할 필요가 없습니다.
00:02:55Claude는 코드 자체가 아닌 Git 로그와 진행 파일에서 프로젝트를 이해할 수 있으므로,
00:03:00세션을 쉽게 재개할 수 있습니다.
00:03:02다음 프롬프트는 단순히 "완료되지 않음"으로 표시된 다음 기능을 구현하는 것입니다.
00:03:06이 접근 방식은 또한 Claude가 적절한 테스트 없이 기능을 완료로 표시하는 경향을 줄여줍니다.
00:03:11각 반복은 실제 테스트를 통해 앱이 처음부터 끝까지 구축되도록 보장하여,
00:03:15코드만으로는 명확하지 않은 버그를 식별하는 데 도움을 줍니다.
00:03:19모든 기능이 `true`로 표시될 때까지 이 주기를 반복합니다.
00:03:22이것이 BMAD 방식과 비슷하다고 생각할 수도 있습니다.
00:03:24유사점은 있지만, Claude의 워크플로가 어떤 면에서는 더 낫다고 생각합니다.
00:03:28에이전트를 개별적으로 호출하지 않아 더 쉬웠고, 컨텍스트 활용도 더 좋았습니다.
00:03:33그렇게 많은 기능을 구현한 후에도 컨텍스트의 84%만 사용했습니다.
00:03:37BMAD였다면 큰 스토리 때문에 이미 두 번이나 컨텍스트 압축이 일어났을 것입니다..
00:03:42그렇지만 BMAD는 여전히 즉시 사용 가능한 완전한 시스템인 반면, 이것은 아직 구현해야 할 아이디어입니다.
00:03:48하지만 BMAD도 Git 시스템과 같은 이 아이디어의 일부를 활용할 수 있을 것입니다.
00:03:51수백만 명에게 AI로 개발하는 방법을 가르친 후, 우리는 이러한 워크플로를 직접 구현하기 시작했습니다.
00:03:57우리는 이전보다 더 빠르고 더 나은 제품을 만들 수 있다는 것을 알게 되었습니다.
00:04:00우리는 앱이든 웹사이트든 여러분의 아이디어를 현실로 만드는 데 도움을 드렸습니다.
00:04:04혹시 저희 영상을 보면서 "좋은 아이디어가 있는데, 이걸 구현할 기술 팀이 없어"라고 생각하셨나요?
00:04:08바로 그럴 때 저희가 필요합니다..
00:04:10저희를 여러분의 기술 공동 조종사라고 생각하세요.
00:04:12우리는 수백만 명에게 가르쳤던 동일한 워크플로를 여러분의 프로젝트에 직접 적용하여,
00:04:17개발팀을 고용하거나 관리하는 번거로움 없이 개념을 실제 작동하는 솔루션으로 전환해 드립니다.
00:04:22여러분의 아이디어를 현실로 빠르게 구현할 준비가 되셨나요?
00:04:25hello@autometer.dev로 연락 주세요. 이것으로 이번 영상은 마무리하겠습니다.
00:04:29채널을 지원하고 저희가 이런 영상을 계속 만들 수 있도록 돕고 싶으시다면,
00:04:33아래의 슈퍼 땡스 버튼을 사용해 주세요.
00:04:36늘 그렇듯이 시청해 주셔서 감사합니다. 다음 영상에서 뵙겠습니다.

Key Takeaway

Anthropic은 AI 에이전트의 컨텍스트 제한 문제를 극복하고 장기 코드 구현 효율성을 높이기 위해 실제 소프트웨어 개발 팀의 워크플로에서 영감을 받은 초기화 및 코딩 에이전트 기반의 새로운 개발 방식을 제안한다.

Highlights

AI 에이전트의 제한된 컨텍스트 창과 장기 작업 비효율성 문제를 해결하기 위한 새로운 접근 방식이 제시되었습니다.

Anthropic은 실제 엔지니어링 팀의 작업 방식에서 영감을 받아 초기화 및 코딩 에이전트를 활용한 워크플로를 개발했습니다.

프로젝트 개요 문서, 기능 목록 JSON, 진행 상황 추적 파일 및 Git 커밋을 통해 체계적인 개발 환경을 구축합니다.

점진적인 기능 구현과 철저한 테스트를 통해 컨텍스트 고갈 및 불완전한 기능 구현 문제를 효과적으로 방지합니다.

Git 로그를 활용하여 세션 재개 및 코드 변경 사항 추적이 용이하며, 오류 발생 시 되돌리기가 가능합니다.

기존 BMAD 방식보다 컨텍스트 활용 효율성이 뛰어나며, 에이전트 호출이 더 간편하다는 장점이 있습니다.

Autometer.dev는 이러한 워크플로를 활용하여 아이디어를 실제 작동하는 솔루션으로 빠르게 구현하는 서비스를 제공합니다.

Timeline

AI 에이전트의 한계점과 비효율성

이 섹션에서는 AI 에이전트, 특히 Claude가 겪는 주요 문제점을 설명합니다. AI 에이전트의 컨텍스트 창이 제한적이어서 이전 작업 내용을 제대로 기억하지 못하며, 이는 장기적인 코드 구현 작업에서 비효율성을 초래합니다. Claude에게 큰 작업을 맡기면 컨텍스트가 여러 번 압축되어 주요 작업을 잊어버리는 현상이 발생한다고 지적합니다. 이러한 문제는 AI 기반 개발의 현재 한계를 명확히 보여주며, 새로운 해결책의 필요성을 제기합니다.

Anthropic이 밝힌 장기 작업 실패 원인

Anthropic은 실제 엔지니어링 환경에서 팀이 작업하는 방식에 착안하여 장기 작업 실패의 두 가지 주요 원인을 분석했습니다. 첫째, 전체 애플리케이션이나 큰 기능을 한 번에 구현하려다 모델의 컨텍스트가 고갈되어 기능이 불완전하게 구현되는 문제였습니다. 둘째, 테스트 기능이 부족하여 Claude가 테스트되지 않은 기능을 완료된 것으로 잘못 표시하는 경향이 있었습니다. 이러한 문제점 분석은 AI 에이전트의 한계를 극복하고 보다 신뢰할 수 있는 개발 프로세스를 구축하기 위한 기반을 마련합니다.

초기화 에이전트 워크플로: 환경 설정

이 섹션에서는 Anthropic이 제안하는 해결책의 첫 번째 단계인 초기화 에이전트의 역할을 상세히 설명합니다. 이 워크플로는 코딩 에이전트를 제대로 초기화하는 데 중점을 둡니다. 구체적으로, 프로젝트 개요를 담은 `Claude.md` 파일, 모든 기능과 테스트 단계를 포함하는 JSON 형식의 기능 목록 파일(초기에는 모든 테스트를 실패로 표시), 개발 서버 시작 스크립트, 그리고 진행 상황을 추적하는 `progress.md` 파일을 생성합니다. 또한, Claude가 매 실행 후 `progress.md`를 업데이트하고, 기능 구현 후 테스트하며, Git에 커밋하도록 하는 가이드라인을 제시하여 체계적인 개발 환경을 구축합니다.

코딩 에이전트 워크플로: 점진적 구현

초기화가 완료된 후, 코딩 에이전트가 기능 JSON 파일에 있는 각 기능을 하나씩 구현하는 과정을 설명합니다. Claude는 각 기능 구현 및 테스트 후 설명적인 커밋 메시지를 작성하고, 필요시 브라우저를 실행하여 앱 작동을 확인합니다. 기능이 작동하면 JSON 필드를 `false`에서 `true`로 업데이트하고 `progress.md`에 진행 상황을 기록한 후 변경 사항을 Git에 커밋합니다. 이러한 점진적인 접근 방식은 세션이 종료되어도 중단했던 지점에서 다시 시작할 수 있게 하며, 적절한 테스트 없이 기능을 완료로 표시하는 경향을 줄여줍니다.

BMAD와의 비교 및 새로운 워크플로의 장점

이 섹션에서는 새로운 워크플로를 BMAD 방식과 비교하며 그 장점을 강조합니다. 새로운 방식은 에이전트를 개별적으로 호출할 필요가 없어 더 쉽고, 컨텍스트 활용도가 훨씬 뛰어나다고 설명합니다. 많은 기능을 구현한 후에도 컨텍스트의 84%만 사용했으며, 이는 BMAD 방식이었다면 컨텍스트 압축이 두 번이나 일어났을 상황이라고 언급합니다. 비록 BMAD는 즉시 사용 가능한 완전한 시스템인 반면, 이 방식은 아직 구현해야 할 아이디어이지만, BMAD도 이 아이디어의 일부를 활용할 수 있을 것이라고 제안합니다.

Autometer.dev 서비스 소개 및 마무리

마지막 섹션에서는 발표자의 회사인 Autometer.dev가 이러한 워크플로를 직접 구현하여 고객의 아이디어를 현실로 만드는 서비스를 제공한다고 소개합니다. 그들은 개발팀을 고용하거나 관리하는 번거로움 없이 개념을 실제 작동하는 솔루션으로 전환해 주는 '기술 공동 조종사' 역할을 자처합니다. 앱이나 웹사이트 등 어떤 아이디어든 빠르게 구현할 준비가 된 사람들을 위해 hello@autometer.dev로 연락할 것을 권유하며, 채널 지원을 위한 슈퍼 땡스 버튼 사용을 독려하며 영상을 마무리합니다.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video