Claude Codeのコンテキスト肥大化を防ぐ実践テクニック:トークン消費を22〜45%削減する方法
Claude Codeで知らぬ間にトークンが消費されている
AIを使ったコード生成・編集ツール(Claude Codeなど)を毎日使っていると、気づかないうちに質問や指示が長くなっていきませんか?
Before: 質問を送るたびにAIがファイル全体やリポジトリ全体を読み込ませるはめになり、1回の質問で数万トークン消費。月額が想像以上に膨らむ。
After: 不要な情報をあらかじめ削除し、必要な部分だけを提供するようにすると、同じ仕事で消費トークンが22〜45%減る可能性がある。
トークン消費の削減は、単なるコスト削減ではなく、応答速度の向上にもつながります。今回は、実際にコンテキスト(質問に含まれる情報量)をスリムにする方法をみていきましょう。
コンテキスト肥大化の主な原因
1. ファイル全体をコピー&ペーストしてしまう
よくあるパターンが、「このバグを直して」と言うときに、問題のある関数だけでなく、そのファイル全体をAIに見せてしまうことです。例えば1000行のファイルで、実際に修正が必要なのは10行だけでも、残り990行はトークン消費に寄与するだけ。
2. GitHubリポジトリ全体を無思考に取り込む
AIツールが自動的にプロジェクトのファイル構造やREADMEまで読み込むよう設定されていると、本来は不要な情報まで含まれてしまいます。古いドキュメントや大量のサンプルコードが入ると、余計に肥大化します。
3. 過去の会話履歴が蓄積し続ける
前の質問と回答がずっと残ったままだと、新しい質問をするたびに前の会話全体がコンテキストに含まれます。結果として、1ヵ月使い続けるとコンテキストウィンドウ(AIが一度に処理できる文字量)の大半が過去の履歴で埋まることもあります。
実践的な削減テクニック
関連部分だけを指定する
バグ修正やコード改善のときは、問題の関数やクラスの周辺コードだけをAIに見せます。ファイル全体ではなく、10〜50行の関連箇所に限定することで、確実にトークン削減につながります。
「XXXという関数の部分だけ見てほしい」「このメソッド(○行目〜○行目)に問題がある」と具体的に指定するクセをつけると、AIも無駄な情報を避けられます。
必要なドキュメントだけをリポジトリに置く
GitHubリポジトリをAIツールに読み込ませるときは、実装に直結するドキュメント(API仕様、インストール手順)だけに限定します。
古いブログ記事のコピーや、廃止済みの機能の説明は削除。ビルドキャッシュやログファイルも除外設定しておくと、AI側が自動的に無視してくれることが多いです。
会話をリセットして新しいセッションを開始する
数日使い続けたセッション(会話スレッド)は、思い切ってリセットするのが効果的です。新しい質問ごとに新しいスレッドを開くイメージです。
特に長期プロジェクトで毎日AI相談している場合、「新しい質問は新しいスレッドで」というルールを自分に課すだけで、コンテキストの肥大化をかなり抑えられます。
前置き情報を短くする
「以下のコードについて〜」という前置きが長いと、それもトークンを消費します。説明は短く、本題(コードスニペット)はできるだけ圧縮した状態で送ります。
「XXXを直して」と一言にして、コードのどこが問題かは行番号やコメントで示す方が、文字数が少なく済みます。
落とし穴・注意点
「短くしすぎて」文脈が失われる
コンテキストを削りすぎると、AIが背景を理解できず、的外れな回答をする可能性があります。「必要最小限」と「最低限の文脈」のバランスが大事です。
もし短い説明でAIの回答がズレていたら、次は関連コードを少し多めに見せるなど、柔軟に調整しましょう。
セッションをリセットすると、AIが過去の前提を忘れる
「この前の修正、今回もそのやり方で」という期待は、新しいセッションではリセットされます。新しいセッションごとに、そのセッションで必要な背景情報は改めて説明する必要があります。
削除したファイル・コードは復元しづらい
コンテキスト最適化のため、リポジトリから不要なファイルを削除するときは、ローカルにバックアップ本を残しておくと安心です。完全削除する前に、「本当に使わないのか」を確認するクセをつけましょう。
応用アイデア
テンプレートファイルの事前準備
よく使うプロジェクト構成やボイラープレートコードを、コンテキストが軽い版にあらかじめ準備しておく。新しいプロジェクトを始めるときに、この軽量テンプレートをベースにして質問すれば、初回から効率的です。
「コンテキスト最適化シート」を作る
自分のプロジェクトごとに「AIに見せるべき情報」と「除外すべき情報」をリストアップしておく。例えば「XXXプロジェクトはREADMEと src/ フォルダだけ、node_modules と .git は除外」という具合です。
新しいセッションを開くたびに、このシートを見ながら質問を準備すれば、ムダなく相談できます。
使用状況の記録
毎週、「今週のトークン消費」と「今週の質問数」をざっくり記録する。トークン効率が改善したセッションの特徴(「細かく分割質問した」「コード量を絞った」など)を記録しておくと、個人のベストプラクティスが見えてきます。
まとめ
Claude Codeなどのツールで月額が想像以上に膨らんでしまうのは、知らぬ間にコンテキストが肥大化しているのが一因です。
関連部分だけを見せる、不要なファイルを除外する、セッションをリセットするなど、シンプルなテクニックで22〜45%のトークン削減が期待できます。
「AIに何もかも見せて任せるのが最適」と思いがちですが、実は「必要な情報だけ、すっきり見せる」ほうが、AIもあなたも幸せです。
出典
- [Dev.to] I Cut Coding Agent Context Usage by 22–45% by Killing Context Bloat
- [Dev.to] How I stopped Claude from cloning entire GitHub repos for a 10-line snippet
- [Dev.to] Your prompt is getting longer without you knowing it (and it’s killing your margins)
- [Dev.to] My OpenClaw agent looked idle overnight and still burned through tokens