Claude Codeのトークンを節約する10の実践テクニック【2026年最新版】

はじめに：あなたのClaude Code費用、正しく把握できていますか？

Claude Codeは強力なAIコーディングアシスタントですが、使い方次第でコストが大きく変わります。Anthropicが公開しているデータによると、開発者1人あたりの平均コストは1日$6、月換算で$100〜$200程度です。チームで複数人が使えば、年間数十万円規模の出費になります。

特に見落とされがちな事実があります。Claude Codeのトークン消費の99.4%は入力トークンです。Claudeは「書く」より「読む」ほうが166倍多くトークンを消費しています。つまり、コスト削減の主戦場は「いかに無駄なコンテキストを読ませないか」にあります。

適切な設定と使い方の工夫によって、50〜70%のコスト削減が可能です。本記事では、すぐに実践できる10のテクニックを優先度順に解説します。

テクニック1：.claudeignore でスキャン対象を絞る

Claude Codeはデフォルトでプロジェクト内のほぼすべてのファイルをスキャン対象とします。node_modules、ビルド成果物、ロックファイルなどを毎回読み込むのは完全な無駄遣いです。

.claudeignore はGitの .gitignore と同じ記法で使えます。プロジェクトルートに配置するだけで有効になります。

# .claudeignore
node_modules/
build/
dist/
.next/
vendor/
coverage/

*.lock
*.log
*.min.js
*.min.css

.env
.env.*
*.pem
*.key

この設定だけで、多くのプロジェクトで20〜40%のトークン削減が見込めます。特にJavaScript/TypeScriptプロジェクトでは node_modules が数千ファイルになることも多く、効果は絶大です。

テクニック2：CLAUDE.md を5,000トークン以下に最適化する

CLAUDE.md はセッション開始時に毎回自動で読み込まれるファイルです。このファイルが肥大化すると、すべての会話のベースコストが増加します。

書くべき内容と書かないほうがよい内容

書くべき内容	書かないほうがよい内容
プロジェクト固有のルール	一般的なコーディング規約
よく使うコマンド	長い背景説明・経緯
重要な制約・禁止事項	詳細な技術ドキュメント
ディレクトリ構成（簡潔に）	サンプルコードの羅列

頻繁には参照しない詳細情報は、Claude CodeのSkills機能（オンデマンドロード）に移行することをお勧めします。.claude/agents/ や .claude/commands/ に分割すれば、必要なときだけ読み込まれます。

実際の事例として、CLAUDE.mdを500行から200行以下に圧縮したことで、トークン消費量が82%削減されたケースがあります。

テクニック3：/clear と /compact を使い分ける

会話コンテキストの管理は、コスト削減において最も直接的な効果をもたらします。

2つのコマンドの違い

コマンド	動作	使いどころ
`/clear`	コンテキストを完全に削除	全く別のタスクに切り替えるとき
`/compact`	会話を要約してコンテキストを圧縮	同じタスクを継続しながら容量を節約したいとき

/compact はデフォルトでAIが自動要約しますが、カスタム指示を渡すことで重要情報を保持させられます。

/compact 以下の情報を必ず保持してください：
- 実装済みの関数名と引数
- 未解決のバグリスト
- 次のステップのTODO

また、「1タスク1セッション原則」を守ることも重要です。1つのセッションで多くのことをやりすぎると、コンテキストが膨らんで効率が落ちます。目安として最大20イテレーションを超えたら /compact または /clear を検討しましょう。

テクニック4：コンテキスト使用量を可視化する

コスト管理の第一歩は「現状把握」です。Claude Codeには使用量を確認するコマンドが用意されています。

# セッションのコスト確認
/cost

# 現在のコンテキスト内容を確認
/context

# 累計使用量の確認
/usage

また、ターミナルのステータスラインにコンテキスト使用率が表示されます（例：Context: 23%）。この数値が50〜70%に達したタイミングで /compact を実行するのが最適なタイミングです。

80%を超えると応答の質が落ちることがあるため、こまめな管理が品質維持にもつながります。

テクニック5：@ファイル参照でピンポイント指定する

漠然とした指示はClaude Codeに大量のファイルを読み込ませる原因になります。

悪い例と良い例

# 悪い例：Claudeが関連しそうなファイルを広く探す
「認証エラーを修正して」

# 良い例：対象ファイルを明示する
「@src/services/auth.ts の validateToken 関数でトークン期限切れ時に
 AuthExpiredError をスローするよう修正して」

@ファイルパス の記法を使うことで、Claude Codeは指定されたファイルのみを読み込みます。

# 複数ファイルをピンポイント指定
「@src/api/users.ts と @src/models/user.ts を参照して、
 ユーザー一覧APIにページネーションを追加して」

曖昧な指示と具体的な指示では、消費トークン数に3〜5倍の差が出ることもあります。

テクニック6：Extended Thinking の上限を下げる

Claude 3.5以降、Extended Thinking（拡張思考）機能がデフォルトで有効になっています。複雑な問題解決には有効ですが、単純なタスクでも数万トークンを消費することがあります。

設定方法

# セッション内でthinkingレベルを調整
/effort low

# 環境変数で上限を設定（.envに記載）
MAX_THINKING_TOKENS=8000

使い分けの基準

タスク種別	推奨設定
バグ修正・小規模変更	`low`（または無効化）
新機能の設計・アーキテクチャ検討	`medium`
複雑なアルゴリズム・最適化	`high`（デフォルト）

ほとんどの日常的なコーディングタスクでは low で十分です。Extended Thinkingを適切にコントロールするだけで、リクエスト単位で大幅なコスト削減が可能です。

テクニック7：タスク複雑度でモデルを使い分ける

Claude Codeで使用できるモデルは複数あり、料金が大きく異なります。

モデル別料金（2026年3月時点・100万トークンあたり）

モデル	入力	出力	特徴
Claude 3 Haiku	$0.25	$1.25	高速・低コスト
Claude 3.5 Sonnet	$3.00	$15.00	バランス重視
Claude 3 Opus	$15.00	$75.00	最高性能

OpusとHaikuでは入力トークンあたり60倍のコスト差があります。

3段階ルーティング戦略

タスク種別	推奨モデル	理由
コード整形・コメント追加・簡単なバグ修正	Haiku	速くて安い
機能実装・リファクタリング・テスト作成	Sonnet	コスト・品質のバランス
アーキテクチャ設計・複雑な最適化・セキュリティ審査	Opus	最高精度が必要

日常業務の70〜80%はSonnetで対応できます。Opusは本当に必要なときだけ使いましょう。

テクニック8：--continue フラグでセッションを引き継ぐ

一度終了したセッションを最初から再開するのは、コンテキストの無駄遣いになります。--continue フラグを使うと、直前のセッションを引き継げます。

# 直前のセッションを続行
claude --continue

# 特定のセッションを再開（セッションIDを指定）
claude --resume <session-id>

# セッション一覧を表示してから選択
claude --resume

`--continue` と `--resume` の違い

--continue：直前のセッションを自動的に引き継ぐ（最も手軽）
--resume：過去のセッション一覧から選択して再開する

セッションを終了する前に /rename 作業名 でセッションに名前をつけておくと、後から --resume で探しやすくなります。複数の作業を並行している場合に特に便利です。

テクニック9：MCPサーバーの未使用を無効化する

MCP（Model Context Protocol）サーバーは便利ですが、接続するだけでトークンを消費します。Linearとのインテグレーションだけで、セッション開始時に約14,000トークン消費されるという計測事例があります。

# 現在のMCP接続状況を確認
/mcp

# 不要なMCPサーバーを設定ファイルから削除
# .mcp.json を編集して、現在のプロジェクトに不要なサーバーを削除する

プロジェクトごとに使用するMCPサーバーを最小限に絞ることが重要です。全プロジェクトで同じ .mcp.json を使い回すのではなく、リポジトリごとに必要なものだけを設定しましょう。

テクニック10：Hooksでログ・テスト出力を前処理する

Claude Codeのタスクによっては、大量のログやテスト結果をコンテキストに流し込む必要があります。しかし生のログをそのまま渡すのは非効率です。

Claude CodeのHooks機能を使って、AIに渡す前にデータを前処理できます。

#!/bin/bash
# .claude/hooks/filter-logs.sh
# 10,000行のログからERRORとWARNINGのみ抽出してClaudeに渡す

LOG_FILE="$1"
FILTERED=$(grep -E "^(ERROR|WARNING)" "$LOG_FILE" | tail -100)

echo "=== フィルタリング済みログ（ERROR/WARNING のみ） ==="
echo "$FILTERED"
echo "=== 元のログ行数: $(wc -l < "$LOG_FILE") 行 ==="

10,000行のログをそのまま渡すと数万トークンを消費しますが、ERRORとWARNINGのみ抽出すれば数百トークンに圧縮できます。削減率は文字通り100分の1以下になることもあります。

同様のアプローチで、テスト結果も「失敗したテストケースのみ」を抽出してから渡す工夫が効果的です。

まとめ：優先度別アクションリスト

以上10のテクニックを、コスト削減効果と実装の容易さで優先度付けしたアクションリストを示します。

優先度	アクション	期待削減率
★★★	.claudeignore を設置	20〜40%
★★★	CLAUDE.md を最適化（200行以下）	15〜30%
★★★	/clear と /compact を使い分ける	50〜70%
★★☆	モデルを複雑度で使い分ける	コスト1/3〜1/5
★★☆	Extended Thinking の上限を下げる	リクエスト単位で大幅削減
★★☆	@ファイル参照でピンポイント指定	タスクによって3〜5倍削減
★☆☆	MCPサーバーの未使用を無効化	セッション開始コスト削減
★☆☆	Hooks でログを前処理	タスク依存（最大1/100）

これらすべてを同時に実施する必要はありません。まず「.claudeignore の設置」「CLAUDE.md の最適化」「/compact の習慣化」という最優先の3つから始めるだけで、多くの開発者が30〜50%のコスト削減を実感できます。

Claude Codeは適切に使えば、コストに見合う強力なツールです。トークンを節約しながら賢く使いこなすことで、開発生産性とコスト効率を両立させましょう。