AIで1セッション製品化:STRATEGY.mdとLLMコントラクト設計の実装手順
このやり方で何ができるか
新しい製品やアプリケーションを作ろうとするとき、通常は複数のセッションにわたってAIと対話を重ねることになります。しかし適切な設計ツールを用意すれば、たった1回のセッションで企画から実装、テストまで完成させることができます。
このワークフローの核となるのが「STRATEGY.md」というファイルです。これは単なるドキュメントではなく、生成AIとの対話を効率的に進めるための「契約書」として機能します。AIエージェントが従うべき戦略や制約をあらかじめ明文化することで、ぶれのない開発が可能になるのです。
さらにこのワークフローでは、コンテキスト(やり取りの履歴情報)を50~87%削減する手法や、自分の失敗から学んで改善するエージェント設計も組み合わせます。その結果、1セッションでも大規模な製品化が実現できるようになります。
準備するもの
必須アイテム
-
テキストエディタ(VSCodeなど)
- STRATEGY.mdファイルを記述するために使用します
- 複数ファイルを同時管理できるものが便利です
-
ChatGPT、Claude、Geminiなどの生成AI
- 対話型のセッションが必要です
- 1セッション内で継続的にやり取りできる仕様のサービス
-
実装環境(Python、JavaScript など)
- 実際にコードを走らせてテストするため
-
プロジェクト管理ツール(任意)
- Notionやスプレッドシートでタスク追跡
- 必須ではありませんが、複雑な製品の場合は便利です
所要時間の目安:準備全体で30分~1時間
手順
ステップ1:STRATEGY.mdを作成する(15~20分)
まず、プロジェクトの根幹となるSTRATEGY.mdファイルを書きます。これは「AIに何をしてほしいか」を明確に指示する設計書です。
ファイルには以下の項目を含めます:
・プロジェクト概要 何を作るのか、目的は何かを1~2段落で記す
・成功の定義 「完成」とはどの状態か、具体的な達成基準を書く 例:「JSONレスポンスの検証エラー率が1%以下」「ユーザー登録完了までが3ステップ以内」
・技術スタック 使う言語、フレームワーク、ライブラリを明記 例:「フロントエンド:React 18、バックエンド:Node.js + Express」
・制約条件 避けるべき実装方法、パフォーマンス要件、セキュリティ要件 例:「外部APIの呼び出しは最大3回まで」「ユーザーデータは暗号化必須」
・AIエージェントへの指示 段階的に何をすべきか、優先順位を番号付きで記す 例:
- コア機能(データ入出力)の実装
- エラーハンドリングの追加
- テストケースの作成
- ドキュメント整備
この構造にすることで、AIが迷わず目的地に向かって進むようになります。
ステップ2:LLMコントラクトとしてSTRATEGY.mdをAIに渡す(5~10分)
作成したSTRATEGY.mdをまるごとAIのセッションに貼り付けます。冒頭で「以下のSTRATEGY.mdに従いながら進めてください」と指示します。
AIの返答時には、「今からステップ1に取り組みます」「ステップ1が完了しました。ステップ2に進みます」というように、進捗をSTRATEGY.mdに紐付ける形で報告させるのが効果的です。
このやり方だと、セッションの途中で会話が脇道に逸れたときも、すぐにSTRATEGY.mdを参照して軌道修正できます。
ステップ3:コンテキスト削減で効率化する(セッション内で継続的に)
長いセッションが続くと、やり取りの履歴がどんどん膨れ上がり、AIの処理が遅くなったり回答の質が落ちたりします。これを防ぐため、定期的に「遅延発見」を組み込みます。
具体的には、セッションの進行中に以下を心がけます:
・不要な過去の会話は削除する 「昨日のこの部分は今もう確認済みなので省きます」と宣言して、古い会話ログを削除
・結果だけを保持する 「ここまでの実装内容は以下のコードで完了」として、確定したコードだけを残す
・中間成果物は統約する 何度も修正した途中経過ではなく、最終版のファイル内容だけAIに提示
このような工夫により、コンテキストサイズを50~87%削減できることが報告されています。結果として、セッションが長くなってもAIの集中力を保ったまま開発を続けられます。
ステップ4:自己改善パイプラインを組み込む(セッション内で反復)
1セッションで完成品を目指すなら、試行錯誤のループを組織的に設計する必要があります。
手順は以下の通りです:
-
実装 → テスト AIが書いたコードを実行して動作確認
-
失敗の記録 エラーメッセージやバグを詳しくAIに報告 「××という入力でエラーが出た。エラーメッセージは△△」という具体的なログを提示
-
AIによる分析と修正 エラー内容から原因をAIに推測させ、コード修正案を提示させる
-
再テスト 修正内容をすぐに実装して動作確認
-
パターン化 同じような失敗が繰り返された場合、AIに「この種のミスを事前に防ぐチェックリストを作ってください」と指示
このループを回すことで、セッションの後半になるほどAIは学習し、ミスが減っていきます。結果として、1セッションで製品レベルの品質に到達できるわけです。
ステップ5:最終確認と納品準備(セッション終盤、30~45分)
セッションの終わりが近づいたら、最終チェックを厳格に行います。
・機能テスト STRATEGY.mdの「成功の定義」に書いたすべての項目が満たされているか確認
・エラーハンドリング 想定外の入力に対してシステムが落ちないか試す
・ドキュメント整備 コードのコメント、使い方ガイド、環境セットアップ手順が揃っているか確認
・パフォーマンス測定 必要に応じて、処理速度やメモリ使用量を計測
すべてクリアしたら、実装コード、設定ファイル、ドキュメントをまとめて一つのパッケージにします。
所要時間の目安:全ステップを通じて1セッション(4~6時間を想定)
つまずきやすいところ
STRATEGY.mdが曖昧すぎる
最初のステップで「〇〇のような機能を作りたい」というざっくりした指示だけだと、AIが迷います。具体的には、「ユーザーが何をできるようになるのか」「データの形式は何か」「どのくらいの速さが必要か」といった細部まで落とし込むことが重要です。
修正のコツ:STRATEGY.mdを作った直後にAIに「このSTRATEGY.mdに不足している情報や曖昧な部分があれば指摘してください」と聞くと、改善点が見つかりやすいです。
セッション途中でAIの回答がぶれる
開発が進むと、AIが以前の判断と矛盾したコードを提案することがあります。これはSTRATEGY.mdの「制約条件」が不十分な場合に起きやすいです。
修正のコツ:矛盾が見つかったら、即座に「このような判断は△△に反しているので、別の方法で実装してください」とSTRATEGY.mdを参照しながら指摘します。
コンテキストが膨れすぎてセッション終了時間に達する
セッションの終了時間制限に引っかかると、せっかくの開発が未完成のまま終わってしまいます。
修正のコツ:ステップ3の「コンテキスト削減」を、セッションの序盤から意識的に実行することが防止策になります。特に、テストで失敗した途中経過は即座に削除し、成功した最終版だけを保持する習慣をつけます。
テストで予期しないバグが出続ける
自己改善パイプラインを回していても、バグが減らない場合があります。これは通常、AIのテスト方法が不十分な場合です。
修正のコツ:「以下の入力パターンすべてでテストしてください」と、網羅的なテストケース例を提示します。例えば、入力フォームなら「空欄」「数字のみ」「特殊文字」「超長テキスト」などです。
慣れてきたら試したいこと
複数のAIエージェントを連携させる
1つのセッションでなく、異なるAIサービス(ChatGPTはデザイン、Claudeはバックエンドコードといったように)を役割分担させて同時進行させると、さらに効率が上がります。この場合、STRATEGY.mdは全員が参照する共通の「契約書」として機能します。
STRATEGY.mdをテンプレート化する
何度も製品を作るようになったら、業種や規模ごとに「STRATEGY.mdテンプレート」を用意しておくと、毎回の作成時間が短縮できます。
失敗パターンの蓄積
何度も開発を重ねる中で出てくる「このような指示だと失敗しやすい」というパターンを、STRATEGY.mdのチェックリストに組み込むと、以降の開発がより滑らかになります。
製品完成後の改善サイクル
1セッションで完成品ができたら、その後「ユーザーフィードバック → 改善案 → 実装」を新しいセッションで回すことで、継続的な改善が実現できます。
あわせて読みたい
- 本番環境でAIエージェントが暴走するのを防ぐ:料金・間違い・情報漏洩を守る実践ガイド
- MCPネイティブなプロンプトツール・アーキテクチャでAIエージェント開発を効率化する実践ガイド
- Claude APIの使い方入門|業務自動化に必要な基本設定と初回実行まで
参考ソース
- STRATEGY.md as code — turning a doc nobody reads into an LLM contract
- I built a product in one AI session. Here's the system that made it ship right.
- Stop Preloading Everything: How We Cut AI Agent Context by 50–87% with Lazy Discovery
- How I Built a Self-Improving AI Agent Pipeline That Fixes Its Own Failures