Claudeの出力トークンを30%削減する「原始人プロンプト」配置術

システムメッセージの末尾に制約事項を詰め込め

Claude 3.5 Sonnetは親切にプログラミングされたモデルです。単に「短く話して」と指示しても、礼儀を尽くそうとしてトークンを浪費します。モデルはプロンプトの最初と最後に最も集中します。この特性を利用し、システムメッセージの最上段には「原始人エンジニア」というペルソナを付与し、最下段には挨拶と要約の禁止を明記してください。指示事項を最後にもう一度強調するだけで、API呼び出しあたりのトークン費用を即座に30%節約できます。

思考は深く、回答は短くする二重構造

出力を減らすからといって、モデルの知能まで下げる必要はありません。論理が複雑なコードを書くときは <thinking> タグを活用してください。思考プロセスは内部タグの中で詳細に行わせ、最終結果のみを収める <answer> タグに「Caveman（原始人）スタイル」を適用する方式です。2026年現在、Claude 4.6 SonnetはOpusモデルに比べ30%程度のコストで高い合格率を示しています。思考プロセスはキャッシュトークンで安価に処理し、高価な出力トークンは核心となるコードのみに集中させれば、正確性と経済性を同時に確保できます。

パースエラーを防ぐ構造的ガードレール

原始人のように話せと命じると、時々JSON構文を壊したり、必須のインポート文を抜かしたりします。個人開発者にとって、このようなパースエラーは「手動修正」というコストを発生させます。システムプロンプトに ---BEGIN JSON--- のような区切り文字の使用を強制し、Pythonの re モジュールを使ってマークダウンのコードフェンスを取り除く後処理スクリプトをパイプラインに組み込んでください。このガードレール一つで、自動化プロセスへの手動介入を90%以上遮断できます。

出力トークン単価15ドル時代の生存戦略

2026年現在、Claude 3.5 Sonnetの出力トークン単価は100万トークンあたり15.00ドルです。入力より5倍も高価です。毎日100回のコーディングリクエストを行う開発者がCavemanモードを適用すれば、月間コストを54ドルから31ドル水準まで下げられます。作業の性質に応じて強度を調節してください。単純な修正はLite、大量のデータ変換はUltraモードといった具合にテンプレートを分ければ十分です。15分投資してプロンプトを修正するだけで、年間276ドルを節約できます。効率的なエンジニアはAIと長く会話しません。必要な情報の密度だけを正確に引き出すのみです。

システムメッセージの末尾に制約事項を詰め込め

思考は深く、回答は短くする二重構造

パースエラーを防ぐ構造的ガードレール

出力トークン単価15ドル時代の生存戦略

Claudeの出力トークンを30%削減する「原始人プロンプト」配置術

Related Video

Caveman Claude Codeが新たなメタに（その科学的根拠を解説）

Claudeの出力トークンを30%削減する「原始人プロンプト」配置術

システムメッセージの末尾に制約事項を詰め込め

思考は深く、回答は短くする二重構造

パースエラーを防ぐ構造的ガードレール

出力トークン単価15ドル時代の生存戦略

Comments (0)

Claudeの出力トークンを30%削減する「原始人プロンプト」配置術

システムメッセージの末尾に制約事項を詰め込め

思考は深く、回答は短くする二重構造

パースエラーを防ぐ構造的ガードレール

出力トークン単価15ドル時代の生存戦略