「ハーネスエンジニアリング」とは何か
GMOインターネットが、AIエージェントのアウトプット品質を「仕組み」で担保する手法——「ハーネスエンジニアリング」を試験導入し、その成果を公開した。
ざっくり言うと、「良いプロンプトを書く」「良いコンテキストを渡す」という人間側のスキルに頼るのをやめて、ルール・制約・自動検証の仕組みを整備することでAIエージェントの出力を安定化させるアプローチだ。ハーネスとは馬具の「手綱」のこと。AIに手綱をつけて制御する、という比喩はわかりやすい。
GMOの谷中氏はこう説明している。
「プロンプトは毎回書き直すため品質の再現性が担保されませんが、ハーネスは一度整備すれば同じ品質を何度でも再現・供給できます」
つまり、一度整備すれば複利で効いていく「仕組みの資産化」こそが本質だ。
なぜ今この話が重要なのか
AI活用の流れは、おおむね3段階で整理できる。
- プロンプトエンジニアリング——良い指示を書くスキル
- コンテキストエンジニアリング——AIに渡す文脈を設計するスキル
- ハーネスエンジニアリング——AIが動ける環境そのものを整備する
1と2の問題は「個人のスキルに依存している」点だ。うまい人が書けば良い出力が出るが、再現性がない。チームスケールで品質を担保しようとすると、どうしても限界がある。
GMOの現場でも同様の壁があったようで、谷中氏はこう語っている。「いくら試行錯誤しても、開発生産性はだいたい2倍あたりで頭打ちになる」——この「2倍の壁」という表現はリアルだ。GitHub CopilotやClaude Codeを入れて効率化した実感はあるけど、それ以上伸びない、という経験をしているチームは少なくないはずだ。
GMOの実態:数字と現場の声
具体的な成果から見ていく。
GMOインターネットは2023年11月にGitHub Copilotの導入を起点として、DevinからClaude CodeへとツールをシフトしながらAI活用を推進してきた。その結果、2026年1Q時点で開発工数50%削減を達成。PLベースの人件費換算で約5,300万円のコスト削減という数字が出ている。
ただし、ここは重要な留保があって、この50%削減はハーネスエンジニアリング単体の成果ではなく、2023年から続けてきた社内AI活用全体の結果だという。ハーネスエンジニアリングは「この50%をさらに引き上げるための新しい打ち手」という位置づけだ。足元の目標は開発生産性5倍、将来的には10倍を見据えている。
成果が出やすい領域と出しにくい領域も、現場の言葉で整理されている。
成果が出やすい領域:
- デザインのスクリーンショット比較によるコーディング検証(正誤が明確に判定できる)
- 仕様が厳密に定義されているAPI開発
課題が残る領域:
- テストコードが書きやすい構造になっていない古いサービス
- 「コードベースに明文化されていない不文律」を持つ既存プロジェクト
後者の「不文律」という表現が刺さる。「このディレクトリの配下だけは別のルール」といった暗黙知をどうハーネスに落とし込むか——これはどの現場でも直面する問題だ。
AIおじさんとしての見方
この記事で一番おもしろいと思ったのは、エンジニアの仕事の変化に関する証言だ。
瀧谷氏はこう語っている。「以前は『こういう感じに動くものを作って』とタスクを与えられて、その通りに動くものを作るだけだったのですが、今はプロンプト1つで割と動くものが出来上がってくるので、その先の部分に取り組む場面が増えてきた」
「その先の部分」というのが具体的で、「アーキテクチャをどう良くしていくか」「この動作は何ミリ秒以内に収めよう」といったパフォーマンスや設計の話だという。つまり、実装の自動化によって、エンジニアが取り組む問題の抽象度が強制的に上がっている。
一方で、副作用も正直に語られている。ジュニアエンジニアが実装やコードリーディングを1人で進められるようになった結果、「後輩から質問をもらった際に改めてコードを読み直す」という自分自身の学びの機会が減った、という話は興味深い。技術の伝承や自己研鑽のあり方まで、静かに変わり始めている。
マネージャーの谷中氏が「エンジニアの評価尺度が変わってきている。書くコードの量や質ではなく、どれだけAIをうまく活用できているかが評価に直結している」と言っているのも、組織運営上は無視できない変化だ。
実務的な示唆と今後の論点
この記事を読んで、自分のチームや組織に引きつけて考えるべき問いは2つある。
1. 自分たちは「2倍の壁」を越えようとしているか?
CopilotやChatGPTを入れて「効率化できた」で止まっているケースは多い。ハーネスエンジニアリングが示しているのは、ツールを入れた後の「仕組み化」に投資しないと、個人スキル依存の非再現な状態から抜け出せないということだ。
2. 暗黙知を明文化する動機が生まれているか?
藤嶋氏の言葉が印象的だった。「口伝えなどで緩く共有されていた認識やノウハウを、AIが判断に困らないような形で明文化してリポジトリに残していかなければいけなくなった」——これはドキュメント文化のない組織には思いのほかきつい要件だ。逆に言えば、ハーネスエンジニアリングへの取り組みが、組織の知識資産化を強制的に促す副産物になりうる。
もう一点、GMOが直面しているコスト管理の問題も現実的だ。「Claude Maxプランは個人契約しか選べない」「エンタープライズ契約に縛られると次のトレンドに乗り換えられない」——このジレンマは、AI活用を本格化させようとしているどの組織にも刺さる話だ。ツール選定とコスト戦略は切り離せない。
まとめ
ハーネスエンジニアリングは、まだ「試験導入・検証フェーズ」の話だ。GMO自身もそう言っている。50%削減という数字は出ているが、それはAI活用全体の積み上げであり、ハーネス単体の効果はこれから問われる。
ただ、「プロンプトの巧拙に依存しない品質の再現性」という問題提起は本質を突いている。個人の職人技をスケールさせる手段として、仕組みに落とし込むというアプローチは、AI以前のソフトウェア開発でも繰り返されてきた話でもある。今その対象が、AIエージェントへの指示出しと品質保証に移っているにすぎない。
後編では「パフォーマンス面の考え方」「ハーネスエンジニアリングを実践するために必要なもの」が語られるとのこと。引き続き注目しておきたいテーマだ。
元記事:【前編】エージェンティックAIの「アウトプット品質安定化」を実現 GMOインターネットが実践する「ハーネスエンジニアリング」とは?