Log in to leave a comment
No posts yet
Claude 3.5 Sonnet은 친절하게 프로그래밍된 모델입니다. 그냥 짧게 말하라고 하면 예의를 차리느라 토큰을 낭비합니다. 모델은 프롬프트의 처음과 마지막에 가장 집중합니다. 이 특성을 이용해 시스템 메시지 최상단에는 원시인 엔지니어라는 페르소나를 부여하고, 최하단에는 인사말과 요약 금지를 명시하십시오. 지시 사항을 마지막에 한 번 더 강조하는 것만으로도 API 호출당 토큰 비용을 즉각 30% 아낄 수 있습니다.
출력을 줄인다고 모델의 지능까지 낮출 필요는 없습니다. 논리가 복잡한 코드를 짤 때는 <thinking> 태그를 활용하십시오. 생각하는 과정은 내부 태그 안에서 상세히 수행하게 만들고, 최종 결과물만 담는 <answer> 태그에 Caveman 스타일을 적용하는 방식입니다. 2026년 기준 Claude 4.6 Sonnet은 Opus 모델 대비 30% 수준의 비용으로도 높은 통과율을 보여줍니다. 사고 과정은 캐싱 토큰으로 저렴하게 처리하고, 비싼 출력 토큰은 핵심 코드에만 집중시키면 정확도와 경제성을 동시에 잡습니다.
원시인처럼 말하라고 하면 가끔 JSON 문법을 깨뜨리거나 꼭 필요한 임포트 구문을 빼먹습니다. 1인 개발자에게 이런 파싱 에러는 수동 수정이라는 비용을 발생시킵니다. 시스템 프롬프트에 ---BEGIN JSON--- 같은 구분자 사용을 강제하고, 파이썬의 re 모듈을 써서 마크다운 코드 펜스를 걷어내는 사후 처리 스크립트를 파이프라인에 넣으십시오. 이 가드레일 하나로 자동화 과정의 수동 개입을 90% 이상 차단합니다.
2026년 기준 Claude 3.5 Sonnet의 출력 토큰 단가는 100만 토큰당 15.00달러입니다. 입력보다 5배나 비쌉니다. 매일 100번의 코딩 요청을 하는 개발자가 Caveman 모드를 적용하면 월 비용을 54달러에서 31달러 수준으로 낮춥니다. 작업 성격에 따라 강도를 조절하십시오. 단순 수정은 Lite, 대량 데이터 변환은 Ultra 모드로 템플릿을 나누면 됩니다. 15분만 투자해서 프롬프트를 수정하면 연간 276달러를 아낍니다. 효율적인 엔지니어는 인공지능과 길게 대화하지 않습니다. 필요한 정보 밀도만 정확히 뽑아낼 뿐입니다.