클로드의 새로운 어드바이저 모드: 성능은 높이고 가격은 더 저렴하게

CChase AI
컴퓨터/소프트웨어경영/리더십AI/미래기술

Transcript

00:00:00Anthropic에서 방금 Advisor 전략을 발표했습니다.
00:00:02이를 통해 Anthropic 모델에서 더 나은 성능을
00:00:05얻을 수 있을 뿐만 아니라 비용까지 절감할 수 있죠.
00:00:09작동 방식은 꽤 간단합니다.
00:00:10Opus를 Advisor(조언자)로,
00:00:12Sonnet이나 Haiku를 Executor(실행자)로 짝을 지어줍니다.
00:00:15즉, Opus가 계획을 세우면
00:00:17더 저렴한 모델이 모든 작업을 수행하는 방식입니다.
00:00:19이는 Claude Code를 사용하면서
00:00:22Opus에게 계획 모드를 실행하게 하고,
00:00:24실제 실행은 Sonnet에 넘기는 것과 매우 유사합니다.
00:00:27차이점은 Advisor 전략의 경우,
00:00:30API를 통해 이 모든 과정이 자동으로 이루어진다는 점입니다.
00:00:32따라서 Claude Code 이외의 환경에서
00:00:34작업할 때 완벽한 솔루션이 됩니다.
00:00:35내부적으로 Anthropic API를 사용하는
00:00:38어떤 종류의 웹 애플리케이션을 운영 중이라면,
00:00:41이건 고민할 필요도 없는 선택입니다.
00:00:42더 저렴한 비용으로 더 효과적인 결과물을 얻게 될 테니까요.
00:00:46사실 Claude Code에서 Opus가 계획하고
00:00:48Sonnet이 실행하는 방식보다
00:00:50조금 더 정교하게 작동합니다.
00:00:52이 Advisor와 Executor의 관계는
00:00:55끊임없이 변화하며, Opus가 한 번 조언하고
00:00:58Sonnet이 실행하는 일회성 작업이 아닙니다.
00:01:01실제로는 서로 상호작용하며 왔다 갔다 하죠.
00:01:02여기에 설명된 것처럼, Executor인
00:01:04Sonnet이나 Haiku가 스스로 해결하기 어려운
00:01:06결정적인 순간에 직면하게 되면,
00:01:08Advisor인 Opus에게 지침을 구합니다.
00:01:11Opus는 Sonnet이 무엇을 하고 있는지 전체 맥락을 파악하고 있습니다.
00:01:15그래서 단순히 전략 하나만 던져주고
00:01:16끝나는 계획 모드와는 다릅니다.
00:01:19Sonnet이 실행을 시도하다가
00:01:22장벽에 부딪히면 다시 Opus에게 돌아가는 식이죠.
00:01:24즉, 지속적인 피드백이 이루어집니다.
00:01:26또한 비용을 낮게 유지하기 위해,
00:01:28Opus는 어떤 시점에서도 도구 호출(tool call)을 하지 않습니다.
00:01:30모든 도구 호출은 더 작은 모델인
00:01:34Sonnet이나 Haiku에 의해 수행됩니다.
00:01:35하지만 Opus는 전체 공유 맥락을 계속 유지하죠.
00:01:39인트로에서 언급했듯이,
00:01:40이 방식은 더 적은 비용으로 더 나은 결과를 제공합니다.
00:01:43여기 지표를 보면 Sonnet 3.5 Sonnet과
00:01:46Opus Advisor 조합을 단독 Sonnet 3.5 Sonnet과 비교하고 있습니다.
00:01:50Sonnet은 SWE-bench에서 72.1 대비 74.8점을 기록했고,
00:01:55비용 또한 더 저렴했습니다.
00:01:56에이전트 작업당 비용이 약 1.09달러였던 것에 비해
00:02:0096센트가 조금 넘는 수준으로, 이는 상당한 차이입니다.
00:02:03BrowseComp나 TerminalBench 같은
00:02:06다른 벤치마크에서도 동일한 결과가 나타납니다.
00:02:0858.1 대비 60.4점을 기록하면서도 비용은 더 저렴하죠.
00:02:12비용이 저렴하다는 것은 정말 큰 장점입니다.
00:02:14모두가 알다시피 Anthropic API는 훌륭하지만,
00:02:16정말 너무 비싸기 때문이죠.
00:02:19종종 Sonnet과 Opus 사이의
00:02:21어딘가에 있는 모델이 필요하다고 느끼지만, 그런 건 없었죠.
00:02:24이 전략은 Sonnet과 Opus 사이의 성능을
00:02:26제공하는 중간 지점을 만들어 주면서도,
00:02:28일반 Sonnet보다도 저렴한 비용으로 이용할 수 있게 해줍니다.
00:02:31정말 좋아하지 않을 이유가 없죠?
00:02:32앞서 말했듯이 이는 Claude Code 기능이 아니라
00:02:33API 차원의 기능입니다.
00:02:35따라서 이를 사용하려면 API 호출 방식을
00:02:38수정하도록 코드를 조정해야 합니다.
00:02:41구체적으로는 타입을 "advisor"로 지정해야 하고,
00:02:45최대 사용 횟수(max_uses)도 설정해야 합니다.
00:02:47여기서 최대 사용 횟수란 특정 문제에 대해
00:02:48조언을 얻기 위해 Opus에게
00:02:50되돌아가는 횟수를 의미합니다.
00:02:52요약하자면, 이건 정말 놀라운 업그레이드입니다.
00:02:54Claude Code 생태계 밖의 실제 프로젝트에서
00:02:56Anthropic API를 사용하는 분들이라면,
00:03:00더 저렴하게 더 나은 결과를 얻을 수 있습니다.
00:03:03아시다시피 대다수의 작업에서 Opus는
00:03:06다소 과한 면이 없지 않아 있지만,
00:03:08가끔은 Sonnet보다 조금 더 나은 성능이 필요할 때가 있죠.
00:03:10그럴 때 이 방법이 완벽한 중도책이 되어줄 것입니다.

Key Takeaway

Anthropic의 어드바이저 전략은 Opus의 지능과 Sonnet의 효율성을 결합하여 단독 모델 사용 대비 SWE-bench 성과를 2.7점 높이면서도 작업당 비용은 약 12% 절감한다.

Highlights

Anthropic의 어드바이저(Advisor) 전략은 고성능 모델인 Opus와 저비용 모델인 Sonnet 또는 Haiku를 결합하여 성능 향상과 비용 절감을 동시에 달성한다.

SWE-bench 테스트 결과 단독 Sonnet 3.5 모델은 72.1점을 기록했으나 Opus 어드바이저 조합은 74.8점으로 성능이 향상되었다.

에이전트 작업당 비용은 단독 Sonnet 사용 시 1.09달러에서 어드바이저 전략 적용 시 96센트 수준으로 감소한다.

Opus는 전체 맥락을 유지하며 조언만 제공하고 실제 도구 호출(tool call)은 저렴한 실행 모델이 전담하여 비용 효율을 극대화한다.

API 호출 시 유형(type)을 advisor로 지정하고 Opus에게 되돌아가는 횟수인 max_uses를 설정하는 방식으로 구현한다.

Timeline

어드바이저와 실행자 모델의 협력 구조

  • 고성능 Opus 모델이 계획을 세우는 어드바이저 역할을 수행한다.
  • 저렴한 Sonnet이나 Haiku 모델이 실제 작업을 수행하는 실행자 역할을 담당한다.
  • API를 통해 이 모든 협업 과정이 자동으로 이루어진다.

Claude Code의 계획 모드와 유사한 이 방식은 웹 애플리케이션 운영 시 비용 대비 효과를 높이는 최적의 솔루션이다. 어드바이저 모델은 전략적 방향을 제시하고 실행 모델은 리소스를 적게 소모하며 실제 결과물을 만들어낸다. 복잡한 문제를 해결할 때 고성능 모델의 지능을 활용하면서도 전체 운영 비용은 낮게 유지하는 구조를 가진다.

실시간 피드백과 도구 호출 최적화

  • 어드바이저와 실행자는 일회성 지시가 아닌 지속적인 피드백을 주고받는다.
  • 실행 모델이 작업 중 장벽에 부딪히면 어드바이저 모델에게 즉시 지침을 구한다.
  • 비용 절감을 위해 모든 도구 호출 작업은 실행 모델에서만 수행한다.

Opus는 전체 작업 맥락을 실시간으로 파악하며 실행 모델이 어려움을 겪는 결정적인 순간에만 개입한다. 실행 모델은 작업을 시도하다가 문제가 발생하면 다시 어드바이저에게 돌아가 교정된 계획을 받는다. 이 과정에서 상대적으로 비싼 Opus 모델은 도구 호출을 직접 수행하지 않아 불필요한 비용 발생을 차단한다.

벤치마크 데이터 기반의 성능 및 비용 우위

  • SWE-bench 및 BrowseComp 등 주요 지표에서 단독 모델보다 높은 점수를 기록한다.
  • 단독 Sonnet 모델보다 저렴한 비용으로 Opus와 Sonnet 사이의 중간 성능 지점을 제공한다.
  • API 코드 내 max_uses 파라미터 설정을 통해 조언 횟수를 제어한다.

실제 데이터에서 Sonnet 3.5와 Opus 어드바이저 조합은 74.8점을 기록해 단독 모델의 72.1점보다 우수한 성능을 입증했다. 비용 면에서도 에이전트 작업당 1.09달러에서 0.96달러로 줄어들어 경제적 이점이 크다. API 사용자는 호출 타입을 advisor로 지정하고 특정 문제에 대해 조언을 구하는 최대 횟수를 설정함으로써 시스템을 정교하게 제어한다.

Community Posts

No posts yet. Be the first to write about this video!

Write about this video