Log in to leave a comment
No posts yet
Claude 3.5 Sonnet — это модель, запрограммированная быть вежливой. Если вы просто попросите ее отвечать кратко, она все равно будет тратить токены на соблюдение этикета. Модели больше всего концентрируются на начале и конце промпта. Используя эту особенность, назначьте роль «инженера-пещерного человека» в самом верху системного сообщения, а в самом низу четко пропишите запрет на приветствия и резюме. Повторное акцентирование инструкций в конце позволяет мгновенно сэкономить 30% затрат на токены за один вызов API.
Сокращение объема вывода не означает, что нужно снижать интеллект модели. При написании кода со сложной логикой используйте теги <thinking>. Сделайте так, чтобы процесс размышления детально проходил внутри внутренних тегов, а к тегу <answer>, содержащему финальный результат, примените стиль «пещерного человека» (Caveman). По состоянию на 2026 год Claude 4.6 Sonnet показывает высокий уровень прохождения тестов при стоимости всего 30% от уровня модели Opus. Если обрабатывать процесс мышления через дешевые кэшированные токены, а дорогие выходные токены направлять только на основной код, можно одновременно добиться и точности, и экономичности.
Если попросить модель говорить как пещерный человек, она иногда может нарушить синтаксис JSON или пропустить необходимые инструкции импорта. Для соло-разработчика такие ошибки парсинга оборачиваются затратами на ручное исправление. Принудительно введите использование разделителей типа ---BEGIN JSON--- в системном промпте и добавьте в пайплайн скрипт постобработки, использующий модуль re в Python для очистки разметки Markdown. Это одно ограничение блокирует более 90% ручного вмешательства в процессе автоматизации.
В 2026 году стоимость выходных токенов Claude 3.5 Sonnet составляет 15,00 долларов за 1 миллион токенов. Это в 5 раз дороже входных токенов. Разработчик, отправляющий 100 запросов на кодинг в день, при переходе в режим Caveman снижает ежемесячные расходы с 54 до примерно 31 доллара. Регулируйте интенсивность в зависимости от характера задачи. Разделите шаблоны на Lite для простых правок и Ultra для массовой трансформации данных. Потратив всего 15 минут на редактирование промптов, вы сэкономите 276 долларов в год. Эффективный инженер не ведет долгих бесед с ИИ — он лишь извлекает необходимую плотность информации.