10:16AI LABS
Log in to leave a comment
No posts yet
에이전트 기반 코딩을 시작할 때 가장 겁나는 건 성능이 아니라 다음 달 카드 명세서입니다. 영상에서 본 이중 에이전트는 환상적이지만, 아무 생각 없이 쓰다간 API 비용 폭탄을 맞기 딱 좋습니다. 2026년 현재 클로드 4.6 오퍼스(Opus)의 입력 단가는 100만 토큰당 3.00)보다 60% 이상 비쌉니다. 출력 비용은 $25.00까지 치솟습니다. 10만 토큰이 넘는 레거시 프로젝트에서 루프가 한 번 돌 때마다 커피 한 잔 값이 날아가는 셈입니다.
비용을 통제하려면 무조건 오퍼스만 고집하지 말고 슬롯 배정 방식을 써야 합니다. 전체 작업의 20%인 설계와 아키텍처 판단에만 오퍼스를 배치하고, 나머지 80%의 단순 구현은 소네트에게 맡깁니다.
--model opus 플래그로 수동 승격합니다. 매주 월요일 아침에 API 리포트를 열어 실제 지출이 예상 곡선을 타는지 확인하는 습관이 필요합니다.에이전트가 쓰는 토큰의 70%는 사실 불필요한 파일을 뒤지고 디렉토리를 탐색하는 데 낭비됩니다. LLM은 컨텍스트가 10만 토큰을 넘어가면 집중력이 급격히 떨어지는 성능 절벽 현상을 보입니다. 모든 소스코드를 다 밀어 넣는 건 돈 버리고 성능 망치는 지름길입니다. 앤스로픽의 내부 테스트 결과를 보면, 컨텍스트를 압축해서 전달할 때 추론 품질은 유지되면서 입력 비용은 50% 이상 줄어듭니다.
AI 전용 명세서인 ARCH.md를 만들어 에이전트에게 지도를 쥐여주십시오.
tree -L 3 -I 'node_modules|dist|.git' > tree.md 명령으로 프로젝트의 뼈대부터 추출합니다. 그다음 레포믹스(Repomix) 같은 도구를 써서 실제 로직은 빼고 함수 시그니처와 인터페이스 정의만 남긴 시그니처 맵을 만듭니다. 마지막으로 .claudeignore 파일에 .svg, .json 같은 에셋을 확실히 적어 에이전트의 시야에서 치워버리십시오.이중 에이전트의 핵심은 설계(Advisor)와 구현(Executor)을 분리해 안전 장치를 만드는 겁니다. 단순히 "코드 리뷰해줘"라고 하면 "깔끔하네요" 같은 영혼 없는 대답만 돌아옵니다. 시니어 엔지니어라면 어드바이저에게 심술궂은 비판자 역할을 강제로 맡겨야 합니다. 이 단계만 제대로 거쳐도 매주 5시간 이상 걸리던 사후 버그 수정 시간을 대폭 줄일 수 있습니다.
실행 모델이 코드를 건드리기 전, 오퍼스에게 비판적 검토를 시키는 장치를 만드십시오.
어드바이저와 이그제큐터를 한 줄로 세워두면 검증할 때마다 대기 시간이 생깁니다. 수백 개 파일을 고쳐야 하는 대규모 리팩토링에서는 이 방식이 너무 느립니다. 5만 라인 이상의 라이브러리를 마이그레이션할 때는 작업을 쪼개서 병렬로 돌리는 오케스트레이션이 필요합니다.
작업 속도를 높이는 병렬 공정은 다음과 같이 짭니다.
git worktree add 명령으로 기능별 독립 디렉토리를 만듭니다. 각 워크트리에서 별도의 클로드 코드 세션을 띄워 서로 다른 모듈을 동시에 리팩토링합니다. 마지막에 클래시(Clash) 같은 도구로 워크트리 간 충돌을 잡으며 메인 브랜치에 합칩니다.AI가 짠 코드가 쌓이다 보면 어느 순간 전체 구조가 엉망이 되는 기술 부채가 발생합니다. 에이전트는 파일 하나는 기가 막히게 고치지만, 시스템 전체가 가야 할 방향까지는 책임지지 않습니다. 2026년 시니어 엔지니어의 진짜 업무는 코드를 직접 타이핑하는 게 아니라, 에이전트들이 만든 결과물의 정렬 상태를 관리하는 것입니다.
매주 금요일 퇴근 전, '아키텍처 감사' 루틴을 돌리십시오.