랄프 위검 기법은 끝났습니다! While 루프를 대체하는 Claude Code Tasks

BBetter Stack
Computing/SoftwareSmall Business/StartupsInternet Technology

Transcript

00:00:00최근 Claude Code 팀이 기존의 to-do를 '태스크(tasks)' 기능으로 업그레이드했다는 엄청난 소식이 전해졌습니다.
00:00:05이제 각 태스크마다 고유한 JSON 파일이 생성되어 깃허브(GitHub)에 업데이트하고 커밋할 수 있게 된 거죠.
00:00:11이 태스크들은 서브 에이전트를 통해 병렬로 실행할 수 있으며, 여러 개의 Claude Code 세션이
00:00:16동일한 태스크 리스트를 공유할 수 있습니다.
00:00:17수많은 태스크와 다중 세션이 필요한 복잡한 프로젝트에 안성맞춤입니다.
00:00:22그렇다면 큰 인기를 끌었던 '랄프 위검(Ralph Wiggum) 루프'는 어떻게 되는 걸까요?
00:00:26이 업그레이드로 인해 이제 쓸모없어진 걸까요?
00:00:28꼭 그렇지만은 않습니다.
00:00:29구독 버튼 누르시고 본격적으로 알아보겠습니다.
00:00:32Opus 4.5는 여러 방면에서 판도를 바꾸어 놓았습니다.
00:00:35잘 알려지지 않은 기능 중 하나는 자율 주행 능력이 훨씬 길어졌다는 점인데,
00:00:39다른 모델보다 상태 유지를 더 잘 수행합니다.
00:00:44따라서 이전에 Claude Code에서 보셨던 고전적인 to-do 리스트는
00:00:48작은 작업에는 거의 필요하지 않게 되었습니다.
00:00:50하지만 긴 작업의 경우, 200k의 컨텍스트 창 내에서도 스마트 존과
00:00:56덤(dumb) 존이 나뉘어 있어, 80% 지점을 넘어가면 멍청한 결과물을 내놓기 시작합니다.
00:01:02컨텍스트에 따른 모델의 스마트 영역과 덤 영역에 대해 더 자세히 알고 싶다면
00:01:07제 랄프 위검 영상을 확인해 보세요.
00:01:08현 단계에서는 태스크를 SQLite 데이터베이스에 저장하고
00:01:14버전 관리를 위해 JSONL 파일로 변환해주는 'Beads' 같은 도구를 사용할 수도 있습니다.
00:01:19Claude Code 팀은 이 Beads 도구에서 영감을 얻어 기존의 to-do를
00:01:24새로운 태스크 관리 시스템으로 업그레이드했습니다. 태스크를 JSON 파일로 저장하는 것부터
00:01:30멀티 세션 실행 등 다양한 기능을 제공하죠.
00:01:34하지만 이 업그레이드가 멋지긴 해도 Beads나 랄프 위검과는 작동 방식이 조금 다릅니다.
00:01:39실제로 어떻게 다른지 보여드리겠습니다.
00:01:41여기 Claude Code가 작성한 계획 파일이 있습니다. CLI를 통해 X나 트위터의 영상을
00:01:46다운로드할 수 있게 도와주는 'XDL' 도구에 추가할 세 가지 주요 변경 사항이 담겨 있죠.
00:01:54태스크 기능을 사용하려면 해당 관리 도구들이 포함된
00:02:00Claude Code 버전 2.1.6 이상이 필요합니다.
00:02:03이제 Claude에게 이 계획 파일을 실행할 태스크 세트로 변환해달라고 요청하겠습니다.
00:02:08보시는 것처럼 태스크가 생성되었습니다. 의존성도 추가되어
00:02:13다른 태스크에 의해 차단된 항목들을 보여주는데, 특정 태스크를
00:02:18가로막고 있는 태스크는 노란색으로 강조 표시됩니다.
00:02:20루트 디렉토리의 .claud 디렉토리로 이동하면 프로젝트별 폴더가
00:02:26포함된 tasks 폴더를 확인할 수 있습니다.
00:02:29열어보면 ID, 주제, 설명, 그리고 어떤 태스크가 이 태스크를 가로막고 있는지,
00:02:36또 이 태스크가 어떤 태스크들을 가로막고 있는지 정리된 파일들이 보입니다.
00:02:41이제 Claude에게 각 태스크를 서브 에이전트에서 실행하도록 시켰고,
00:02:45그 작업이 진행되었습니다.
00:02:46태스크 1과 함께 다른 태스크에 막혀 있지 않은
00:02:52태스크 8, 9, 10이 동시에 처리되고 있습니다.
00:02:53상단에서 여러 서브 에이전트가 각기 다른 태스크를 작업하는 모습도 볼 수 있죠.
00:02:57모든 태스크가 완료된 후 컨텍스트 사용량을 확인해보니,
00:03:01서브 에이전트 덕분에 단 18%만 사용되었습니다.
00:03:06새로운 태스크 관리 시스템으로 할 수 있는 게 또 있습니다.
00:03:09Claude 세션을 여러 개 실행하고 싶을 때—지금처럼 화면을 분할하거나
00:03:14다른 탭이나 서버를 사용하더라도—동일한 태스크 리스트에 접근하려면,
00:03:19환경 변수인 'Claude code task list ID'를 실행하고 사용하려는
00:03:26태스크 리스트의 디렉토리 ID를 입력하면 됩니다.
00:03:30그러면 Claude가 해당 디렉토리의 모든 태스크에 접근할 수 있게 되며,
00:03:34다른 세션에서도 똑같이 할 수 있습니다.
00:03:36한쪽 세션에는 태스크 진행을 요청하고, 다른 쪽 세션에는
00:03:41태스크 완료 여부를 검증하라고 시킬 수 있는 거죠.
00:03:43왼쪽 세션을 실행하면 오른쪽 세션에서도 각 태스크의
00:03:48진행 상황을 실시간으로 파악할 수 있습니다.
00:03:49왼쪽 작업이 끝나면 오른쪽 세션에서 바로
00:03:53태스크가 제대로 완료되었는지 검증 단계로 들어갈 수 있습니다.
00:03:55정말 유용한 기능입니다. 한 컴퓨터에서 태스크를 시작했다가 중단하고,
00:04:00해당 태스크를 깃허브나 즐겨 쓰는 버전 관리 시스템에 커밋한 뒤,
00:04:06다른 컴퓨터에서 풀(pull)을 받아 정확히 멈춘 지점부터 이어서 작업할 수 있으니까요.
00:04:10Beads를 써보셨다면 작동 방식이 비슷하다는 걸 아시겠지만,
00:04:15완전히 같지는 않습니다. Beads는 빠른 검색을 위해 태스크를 SQLite 데이터베이스에 저장하고,
00:04:23여러 JSON 파일이 아닌 단일 JSONL 파일로 동기화하기 때문입니다.
00:04:29그래서 이 단일 파일을 프로젝트에 추가해 팀원들과 공유할 수 있죠.
00:04:33또한 철학적인 측면에서 랄프 위검 루프와도 차이가 있습니다.
00:04:39랄프 루프는 단일 프롬프트와 태스크 리스트가 있고,
00:04:43해당 프롬프트를 달성하기 위한 태스크들을 모델에게
00:04:48반복해서 보내는 방식입니다.
00:04:49반면 새로운 태스크 관리 시스템은 전체 태스크 리스트 중에서
00:04:54모델이 다음에 해야 할 일을 직접 선택하게 합니다.
00:04:57모델이 모든 태스크를 훑어보며 다음 순서를 찾는 거죠.
00:05:02단일 태스크를 수행하는 서브 에이전트를 쓰면 이 부담이 줄어들긴 하지만,
00:05:07사용자가 설정한 '북극성(North Star)' 지표를 따라 무한히 지속되는 자율 루프를 원한다면,
00:05:12즉 prompt.md 파일의 지침대로 직접 추가하지 않은 태스크까지 수행하며 프로젝트를 개선하길 원한다면,
00:05:17이 새로운 태스크 관리 시스템은 여러분이 찾는 도구가 아닐 수도 있습니다.
00:05:22문서화 문제도 있습니다. 녹화 시점을 기준으로
00:05:27이 기능에 대한 모든 정보는 트윗 하나가 전부이기 때문입니다.
00:05:30Beads에 비하면 태스크 진행 상황을 한눈에 볼 수 있는 시각화 도구나
00:05:34칸반(Kanban) 스타일의 도구도 부족하지만, Claude Code 커뮤니티가
00:05:40지금쯤 열심히 개발하고 있을 것이라 확신합니다.
00:05:42이런 새로운 도구 관리 시스템들로 소프트웨어를 개발하다 보면,
00:05:47사용자에게 에러가 포함된 결과물을 배포하지 않도록 주의해야 합니다.
00:05:50이때 Better Stack이 유용합니다. AI 기반 에러 트래커를 통해 프로젝트의
00:05:56백엔드와 프런트엔드 에러를 추적할 수 있고, 사이트 다운 시 사용자에게 알리는
00:06:02상태 페이지와 훌륭한 인시던트 관리 시스템도 제공합니다.
00:06:08지금 바로 Better Stack을 확인해 보세요.

Key Takeaway

Claude Code의 새로운 태스크 관리 시스템은 JSON 기반 버전 관리와 서브 에이전트 병렬 실행을 통해 복잡한 프로젝트의 협업 및 자율 수행 능력을 한 단계 진화시켰습니다.

Highlights

Claude Code의 기존 to-do 기능이 JSON 기반의 새로운 '태스크(tasks)' 시스템으로 대폭 업그레이드되었습니다.

태스크별 고유 JSON 파일 생성 및 GitHub 연동을 통해 여러 세션과 팀원 간의 작업 공유 및 버전 관리가 가능해졌습니다.

서브 에이전트를 활용한 태스크 병렬 실행 기능으로 컨텍스트 사용량을 최적화하고 복잡한 프로젝트 처리 효율을 높였습니다.

기존의 '랄프 위검 루프'와 달리 모델이 스스로 전체 태스크 리스트를 검토하고 다음 단계를 결정하는 구조를 취합니다.

Beads와 같은 도구에서 영감을 받았으나 저장 방식(SQLite vs 개별 JSON)과 실행 철학 면에서 차이점이 존재합니다.

다중 세션을 실행하여 한쪽에서는 개발 태스크를 수행하고 다른 쪽에서는 실시간 검증을 진행하는 워크플로우가 가능합니다.

Timeline

Claude Code 태스크 시스템의 혁신적 변화

Claude Code 팀이 기존의 단순한 to-do 리스트를 '태스크(tasks)' 기능으로 업그레이드했다는 소식을 전하며 시작합니다. 이제 각 태스크는 독립적인 JSON 파일로 생성되어 GitHub에 커밋하거나 팀원과 공유할 수 있는 자산이 되었습니다. 특히 서브 에이전트를 통한 병렬 실행이 가능해져 복잡한 프로젝트를 다중 세션으로 처리하는 데 최적화되었습니다. 기존에 인기를 끌었던 '랄프 위검 루프' 기법의 효용성에 대해 의문을 던지며 본격적인 분석을 예고합니다. 이 섹션은 새로운 시스템이 단순한 기능 추가를 넘어 워크플로우 자체를 바꿀 것임을 암시합니다.

Claude 3.5 Opus의 능력과 컨텍스트의 한계

Claude 3.5 Opus 모델이 가진 자율 주행 능력과 상태 유지 능력의 향상에 대해 설명합니다. 모델이 200k의 넓은 컨텍스트 창을 가지지만, 80% 지점을 넘어서면 지능이 떨어지는 '덤(dumb) 존' 현상이 발생함을 지적합니다. 이를 극복하기 위해 태스크를 효율적으로 관리하는 'Beads'와 같은 도구의 영감과 SQLite 데이터베이스 활용 사례를 언급합니다. 결과적으로 Claude Code는 이러한 외부 도구의 장점을 흡수하여 자체적인 태스크 관리 시스템을 구축하게 되었습니다. 이 과정은 모델의 지능을 유지하면서도 긴 작업을 효율적으로 수행하기 위한 전략적 선택임을 강조합니다.

실전 태스크 생성 및 병렬 실행 시연

실제 'XDL' 도구의 변경 사항을 담은 계획 파일을 태스크 세트로 변환하는 과정을 구체적으로 시연합니다. Claude Code 버전 2.1.6 이상에서 작동하며, 생성된 태스크들은 상호 의존성에 따라 노란색으로 시각화되어 가독성을 높여줍니다. 루트 디렉토리의 .claud 폴더 내에 저장된 JSON 파일들을 통해 ID, 주제, 설명 및 차단 관계가 명확히 정리된 것을 확인할 수 있습니다. 시연 중 태스크 1과 함께 의존성이 없는 다른 태스크들이 서브 에이전트에 의해 동시에 처리되는 병렬 작업의 위력을 보여줍니다. 최종적으로 서브 에이전트 덕분에 전체 컨텍스트 사용량이 18%에 불과했다는 놀라운 효율성을 입증합니다.

멀티 세션 활용 및 버전 관리의 이점

동일한 태스크 리스트를 여러 세션에서 동시에 활용하는 고급 기법을 소개합니다. 환경 변수 설정을 통해 다른 탭이나 컴퓨터에서도 동일한 태스크 디렉토리 ID에 접근하여 작업을 이어갈 수 있습니다. 한쪽 세션에서는 코드를 작성하고 다른 쪽 세션에서는 실시간으로 완료 여부를 검증하는 협업 모델을 제시합니다. 이러한 방식은 작업을 중단했다가 GitHub에 커밋한 후 다른 환경에서 즉시 재개할 수 있는 강력한 유연성을 제공합니다. 이는 단순한 개인 도구를 넘어 팀 단위의 개발 환경에서 Claude Code가 어떻게 쓰일 수 있는지를 보여주는 핵심 대목입니다.

기존 기법과의 비교 및 향후 전망

새로운 시스템과 기존 Beads 도구, 그리고 랄프 위검 루프 사이의 철학적 차이점을 명확히 정리합니다. Beads가 단일 JSONL 파일을 사용하는 반면 Claude Code는 개별 JSON 파일을 사용하며, 모델이 직접 다음 할 일을 선택한다는 점이 특징입니다. 만약 사용자의 개입 없이 '북극성' 지표만을 따라 무한히 루프를 도는 자율성을 원한다면 기존 방식이 더 나을 수도 있다고 조언합니다. 아직은 문서화나 시각화 도구가 부족하지만 커뮤니티의 발전을 통해 칸반 스타일 등의 보완이 이루어질 것으로 기대합니다. 마지막으로 배포 전 에러 추적을 위한 Better Stack의 활용을 추천하며 마무리합니다.

Community Posts

View all posts