はじめに:プロンプトから「ハーネス」へと重心が移っている
AI を業務で使う現場では、2025 年後半から「プロンプトエンジニアリング」だけでは足りない局面が急増しています。ChatGPT に 1 回だけ質問するなら巧みなプロンプトで十分ですが、Claude Code のような自律的に動くエージェントを本番環境に載せる段階になると、プロンプトの外側にある「ツール」「コンテキスト」「ガードレール」「評価ループ」といったシステム要素が成否を決めます。
この外側の設計領域を指す言葉として、2026 年に急速に普及したのが ハーネスエンジニアリング(Harness Engineering) です。本記事では、プロンプトエンジニアリングと何が違い、何を学ぶべきかを、Claude Agent SDK の具体機能を交えながら整理します。
プロンプトエンジニアリングとは
プロンプトエンジニアリングは、「モデルに送る自然言語入力を設計・最適化する技術」 です。役割指定、Few-Shot、Chain of Thought、出力フォーマット指定などを駆使し、同じモデルから品質の高い応答を引き出すスキルを指します(入門編はプロンプトエンジニアリング入門記事を参照)。
要点は 1 回のやり取りの品質最大化です。スキルの中心はライティングにあり、プログラミングは必須ではありません。
ハーネスエンジニアリングとは(Harness Engineering)
定義:モデル以外のすべて
ハーネスエンジニアリングは、「AI モデルの周囲に配置する、モデル以外のすべての実行基盤を設計する技術」 です。Martin Fowler のテックサイト、OpenAI、Red Hat Developer などが 2026 年に相次いで解説記事を公開し、用語として定着しつつあります。
馬具の「ハーネス」が由来で、「賢い馬(モデル)を安全かつ有用に働かせるための装備一式」というニュアンスです。
式で表す:Agent = Model + Harness
業界で広く引用されている定式化が以下です。
Agent = Model + Harness
モデル性能が上がってもエージェントが本番で動かない原因の多くは、ハーネス(周辺実装)の欠如にあるとされます。実際、2026 年の AI Engineer World's Fair では「エージェントプロジェクトの大多数が本番に届かない」という問題提起が複数スピーカーから行われ、ハーネス設計が次の最優先領域として位置付けられました。
両者の違いを比較表で整理
| 観点 | プロンプトエンジニアリング | ハーネスエンジニアリング |
|---|---|---|
| 対象 | モデルへの入力テキスト(1 ターン単位) | モデルを取り囲む実行基盤全体 |
| 主な責務 | 出力品質の最大化 | 安定稼働・安全性・再現性・スケール |
| 必要スキル | ライティング、論理構造化、言語感覚 | システム設計、API 設計、CI/CD、オブザーバビリティ |
| 代表テクニック | 役割指定、Few-Shot、CoT、ReAct | ツール定義、サブエージェント、フック、評価ループ |
| 成果物 | プロンプト、テンプレート | エージェント実装、ツール、設定ファイル、監視基盤 |
| 評価指標 | 応答の的確さ・簡潔さ | タスク成功率、コスト、レイテンシ、事故率 |
| 失敗時の影響 | 出力 1 件の品質低下 | 本番稼働停止、データ破損、権限逸脱 |
| 担当ロール | プロンプトエンジニア、ライター | AI エージェントエンジニア、プラットフォームエンジニア |
プロンプトエンジニアリングが「言葉の設計」なら、ハーネスエンジニアリングは「システムの設計」です。両者は対立ではなく、後者が前者を内包する関係にあります。
ハーネスエンジニアリングで扱う 7 つの具体要素
ハーネスは以下の要素から構成されます。どれも欠けるとエージェントは本番に耐えません。
1. システムプロンプト / プロジェクト規約
CLAUDE.md のような永続プロンプトで、ディレクトリ構造、テストコマンド、コーディング規約、禁則事項を機械可読な形で宣言します。エージェントが毎回読み込む「プロジェクトの憲法」です。
2. ツール定義
外部 API、ファイル操作、シェル実行などをエージェントが使うためのインターフェースです。設計時には以下を必ず考えます。
- 入出力スキーマ(JSON Schema 等)
- 権限境界(どのパスまで書き込み可か)
- 冪等性(同じ呼び出しを 2 回実行しても安全か)
- エラーハンドリングとリトライ
- レート制限
3. コンテキスト管理(Context Engineering)
何を検索し、どう並べ、どの形でモデルに渡すかの設計です。RAG、ベクトル検索、チャンキング、ルーティング、コンテキストウィンドウ節約など、いわゆるコンテキストエンジニアリングはハーネスエンジニアリングの中核部分として位置付けられます。
4. メモリ / 状態永続化
セッションをまたいだ記憶や、ファイルベースの作業状態です。長いタスクを分割実行するために欠かせません。
5. エラーハンドリング / 自己修復
テスト失敗やリンタエラーをエージェントにフィードバックし、自動で修正を試みる write-test-fix サイクル が代表例です。
6. 評価ループ(Evals)
タスク成功率、コスト、事故件数などをオフラインで継続計測する仕組みです。プロンプト 1 行の変更がエージェント全体の挙動を変えるため、回帰テストが不可欠です。
7. ガードレール
権限チェック、アーキテクチャ制約、危険コマンドのブロック、PII フィルタ、レート制限など、事故を未然に防ぐ層です。
Claude Code / Claude Agent SDK で見るハーネスの実例
Anthropic が公開する Claude Agent SDK は、Claude Code が内部で使っているハーネスを外部開発者向けに SDK 化したものです。上述の要素がそのまま機能として提供されています。
サブエージェント(Subagents)
主エージェントが専門タスク用の子エージェントを起動し、コンテキストを分離して実行します。本記事のパイプラインでも「Trend Researcher」「Content Writer」といったサブエージェントを使っています。
フック(Hooks)
ツール呼び出し前後やセッション開始・終了などのイベントに、シェルスクリプトや関数を差し込めます。
# 例: 危険コマンドをブロックするフック
# .claude/hooks/pre-bash.sh
if [[ "$COMMAND" =~ rm\ -rf\ / ]]; then
echo "BLOCKED: destructive command"
exit 1
fi
ガードレールやロギングの典型的な実装先です。
MCP(Model Context Protocol)
ツールやデータソースを標準化プロトコルで接続する仕組みです。mcp__<server>__<tool> の命名規約で公開され、必要なときだけ遅延ロードできるためコンテキストを節約できます。GitHub、Slack、データベースなどのアクセスを共通インターフェースで扱えます。
スラッシュコマンド / Skills
定型タスクをコマンド化して再利用します。本リポジトリでも @content-pipeline-orchestrator のような形でパイプラインを一撃起動できます。ナレッジをパッケージ化した Skills もコンテキスト節約の重要な仕掛けです。
CLAUDE.md
プロジェクト規約をエージェントが常に参照する永続プロンプトです。ディレクトリ構造・コーディングルール・禁則事項を書いておくことで、毎回の指示を最小化できます。
なぜ今ハーネスエンジニアリングが重要なのか
2025〜2026 年にかけて、業界の関心は明確に次のように推移しました。
- 〜2024: プロンプトエンジニアリング(言葉の設計)
- 2024〜2025: コンテキストエンジニアリング(渡す情報の設計)
- 2026〜: ハーネスエンジニアリング(実行基盤全体の設計)
背景には以下の構造的変化があります。
- モデル性能の頭打ちではなく「統合の難しさ」がボトルネック: GPT-5、Claude、Gemini 2.5 いずれも推論能力は十分。差がつくのは外側の設計。
- エージェントの本番投入率の低さ: 多くのエージェントプロジェクトが PoC 止まりで、原因はハーネス未整備と分析されています。
- ツール連携の標準化(MCP): 標準プロトコルが整ったことで、ハーネス設計がようやく再現可能なエンジニアリング領域になりました。
- コスト・レイテンシ・安全性の本番要件: 評価ループ、ガードレール、オブザーバビリティが必須に。
端的に言えば、「動くデモ」と「本番で動き続けるエージェント」の差を埋める領域がハーネスエンジニアリングです。
プロンプトエンジニアからハーネスエンジニアへのキャリアパス
プロンプトエンジニアリングで培った言語化能力は、ハーネスエンジニアリングでもそのまま活きます。その上で以下のスキルを積み足すのが王道です。
- ツールインターフェース設計: JSON Schema、権限、冪等性、エラーハンドリング
- コンテキストエンジニアリング: RAG、チャンキング、ベクトル検索、クエリルーティング
- エージェントオーケストレーション: 状態機械、ワークフロー、プランナー、ツールルーター
- 評価(Evals): オフライン評価、回帰テスト、A/B、タスク成功率の定義
- オブザーバビリティ: トレース、ログ、メトリクス、コストモニタリング
- ガードレール・セキュリティ: プロンプトインジェクション、権限分離、PII
- CI/CD とデプロイ: エージェントのリリース戦略、カナリア
新しい肩書きとして 「AI エージェントエンジニア」「Staff AI Agent Engineer」 が 2026 年に登場しており、プロンプトエンジニアからのキャリア移行先として注目されています。
学習の第一歩としておすすめなのは、Claude Agent SDK のサブエージェント・フック・MCP を実際に触ってみることです。手元の小さなエージェントに対して、ツール 1 つ、フック 1 つ、評価 1 件を追加するところから始めると、ハーネスの全体像が体感的に掴めます。
まとめ
- プロンプトエンジニアリングは言葉の設計、ハーネスエンジニアリングはシステムの設計。
- 式で表すと
Agent = Model + Harness。本番での成否はモデルではなくハーネスで決まる。 - ハーネスの構成要素は、システムプロンプト・ツール定義・コンテキスト管理・メモリ・エラーハンドリング・評価・ガードレールの 7 つ。
- Claude Agent SDK のサブエージェント・フック・MCP・スラッシュコマンド・CLAUDE.md が具体実装例。
- 2026 年以降は、プロンプトエンジニアからハーネスエンジニアへのキャリア移行が王道の進化ルート。
プロンプトを磨くだけの段階は終わりました。次に身につけるべきは、モデルを働かせる装備一式を設計する力です。手元の小さなエージェントから、ハーネスを一つずつ組み上げてみてください。