記事一覧
50 件
PoCは動く、本番は壊れる──9社のAIエージェント運用から見えた「評価と観測」という共通の壁
AIエージェントの開発に関する特集記事で、9社の技術選定や運用の課題と解決策が紹介されています。
NVIDIAのロボット研究が示す「シミュレーション→現実」のリアルな到達点
NVIDIA Researchは、ロボティクスのシミュレーションから現実世界への移行を進めており、ICRAで発表された論文群がその基盤を示しています。
Anthropicが国防総省と決裂した本当の理由——「完全自律型兵器」をめぐる構造的な断絶
AI技術の進展により、自律型兵器の開発が進んでいる中、Anthropicと国防総省の間での契約交渉が破綻し、AI兵器の倫理的リスクが浮き彫りになっています。
AIエージェントに「自分を改善させる」仕組みを企業で動かすには、何を先に決めておくべきか
企業AIエージェントにおけるメタハーネスの設計理論を探求し、自己改善ループの構造と運用の重要性を論じる。
「100兆円市場」を狙う日立×Anthropicの本気度——フィジカルAIで日本企業が勝てる理由と、まだ見えない課題
日立が米Anthropicと提携し、フィジカルAI市場での競争力を強化する戦略を発表。100兆円規模の市場を狙い、AI技術を活用した社会インフラの革新を目指す。
AIが1秒で作るノイズを、人間が数日かけて処理する構造——「ミトス問題」が教える工数崩壊のリアル
元Yahoo!エンジニアの山田健太郎が、AIスクリーニングによる工数崩壊の問題とその対策を考察しています。
日立×Astemo、自動運転AI開発基盤を2026年度末に構築へ——デジタルツインで「現実では再現困難なシナリオ」を量産する狙い
日立製作所とAstemoは、自動運転車両向けのAI開発基盤を2026年度末までに構築することを発表しました。デジタルツインとフィジカルAIを活用し、安全性と快適性を両立させることを目指します。
AIが生成したpandasコードは「動く」けど「正しい」とは限らない——3つの地雷と検証ワークフロー
AI生成のpandasコードには、実務でのパフォーマンスやデータ整合性に影響を与える静かな地雷が存在します。本記事では、その地雷を特定し、検証ワークフローを提案します。
Gemini 3.5 Flashが示す転換点——GoogleはAIを「話す道具」から「働く主体」へ変えようとしている
Googleは、最強のAIモデルGemini 3.5 Flashを発表し、AIを会話ツールからエージェントツールへとシフトさせることを目指しています。
生成AIのリスクは「出力」より「入力」にある——権利・機密・心理的反発を実務で整理する
生成AIの利用には、権利や機密情報、品質、心理的反発といったリスクが存在し、それらを適切に管理することが求められています。
AI生成コードを「本番品質」に仕上げる5つのレビュー基準——14日デプロイの現場から
AI生成コードを本番品質にするための5つのレビュー基準を紹介する記事です。
AIエージェントにコードを書かせるとき、あなたはどこまで「信頼」しているか
生成AIを用いたソフトウェア開発におけるセキュリティの問題点を整理し、AIエージェントの権限拡大や脆弱性について考察しています。
CI/CDの次に来るもの——「エージェントネイティブ開発」が変える開発組織の形
AIコーディングは単なるコード生成を超え、開発プロセス全体を自律的に処理するエージェントネイティブな運用へと進化しています。
CopilotのUI刷新が意味するのは「AI導入」ではなく「業務設計の前提変更」だ
Microsoft 365のCopilotがAI機能を統合し、業務プロセス設計を根本から変える方向に進化した。
Physical AIは本当にソフトウェアエンジニアの次の戦場か?2026年の現実を整理する
2026年、Physical AIがソフトウェアエンジニアの新たな戦場となる理由を探る記事です。ヒューマノイドロボットの進化とソフトウェアスタックの標準化が鍵となります。
Claude Code・Cursor・Codex、3ヶ月使い倒してわかった「正しい使い分け」の話
Claude Code、Codex、Cursorの3つのAIコーディングツールの使い分けについて、実務での経験を基にした具体的なガイドラインを提供しています。
AIコーディングは「プロンプト職人」を目指すと負ける。「仮想開発組織」を作る発想に切り替えよ
AIコーディングの本質は、プロンプトに依存するのではなく、仮想開発組織を構築することにあると論じています。
「ステップ2は?」——AIが変革をもたらすという約束の、巨大な空白を直視する
AIの変革の約束と実際の能力のギャップが浮き彫りになり、誇大広告の背景には中間プロセスの不透明さがあることが指摘されています。
「AIがAIを作る」時代が来た。OpenAIとAnthropicが警告するRSIの現実
OpenAIとAnthropicの研究者たちは、再帰的自己改善(RSI)が現実化しつつあり、AIの進化が人間の理解を超える可能性があると警告しています。
AIを「一つの正解」に収束させるのは本当に安全か? 境界情報幾何学(BIG)が問うアライメントの盲点
この記事では、AIアライメントにおける「認知的単一化」のリスクと、境界情報幾何学(BIG)の概念を通じて知性の多様性を維持する方法について論じています。
EU AI Actが開発現場を変える:2024年版、エンジニアが今すぐ知るべき規制の実務ポイント
2024年のAI規制の最新動向を解説し、特にEUのAI Actや日本のガイドラインについて詳述しています。
卓球ロボット「Ace」がエリート選手を倒した。これがロボティクスに示す本当の意味
テーブルテニスロボット「Ace」が世界のトップ選手に勝利し、ロボティクスの新たな可能性を示しました。
「フィジカルAI」が製造業を変える——ただし、壁はソフトウェアではなくハードウェアにある
フィジカルAIは、ロボットが環境に適応し学習する能力を向上させ、製造業における新たな革命をもたらしています。
AIコーディングツールを配るだけでは、何も変わらない——BPRとして設計しないと詰む理由
AIコーディングツールの導入は単なるツール選定ではなく、開発プロセスや人の役割を見直す必要があると述べています。
「コードを書く力」の希少性が下がった時代に、エンジニアは何で勝負するのか
バイブコーディングの普及により、エンジニアの価値は「コードを書く技術」から「問題を定義する技術」に移行している。これにより、ソフトウェア開発の需要が増加している。
AIが書いたコードをどこまで信用するか——4つの戦略と、今選ぶべき現実解
AIが生成するコードの品質を担保するための4つのレビュー戦略を提案し、現時点ではテスト中心レビューが最も現実的であると結論づけています。
「世界モデル」がAI開発の本命になりつつある理由——LLMの脆弱さと、その先にあるもの
世界モデルはAIが物理的現実を理解し、行動の結果を予測するための重要な技術として注目されています。
AIの「重心」が学習から推論に移った——この構造変化がエンジニアの仕事を変える
AIの重心が学習から推論に移行しており、推論需要が急増していることが明らかになった。これにより、コスト構造やエンジニアリング指標が変化している。
AIブームの「5つの危険信号」を読み解く——楽観論だけで動くと見えないリスクがある
AI業界の成長の裏で、5つの危険信号が浮上している。これらは業界の構造的脆弱性を示しており、特にインフラ投資や企業の信頼性に影響を及ぼす可能性がある。
「責任を固定した」で終わっていいのか——AIガバナンスに欠けている「固定後」の設計
AIガバナンスにおいて、責任固定だけでは不十分であり、責任経路設計が必要であることを論じています。
同じ質問を5回投げたら5つの別回答が返ってきた——LLMが嘘をつく「仕様」を理解する
同じ質問に対して異なる回答が得られる理由を探る実験を通じて、LLMの設計に起因する構造的な問題が明らかになりました。
電子部品ゼロ、バッテリーゼロ、脳ゼロ——「形が知性になる」ロボット群を見てわかること
ジョージア工科大学の研究者たちが、電子部品やバッテリー、脳を持たないロボットの群れを開発しました。これらのロボットは、物理的な接触を通じて相互作用し、形状によって行動を制御します。
ロボタクシーの安全性をNVIDIAが本気で作り込む:OpenUSDとHalosが変える自律走行の現実
NVIDIAはOpenUSDとHalosフレームワークを活用し、ロボタクシーや物理AIシステムの安全性を向上させるための新しいワークフローを提供しています。
テスラがロボット工場へ本気シフト——年産1000万台という数字の重さを読む
テスラはテキサス州の新工場で、オプティマスロボットの年間生産能力を1000万台に引き上げる計画を発表しました。
「スライム状の人工筋肉」が変える、ロボット設計の常識——自己修復・再構成・リサイクルを1つの素材で
新しいタイプの人工筋肉が、リアルタイムで形状を変え、損傷から回復し、複数のロボットに変身できる技術が開発されました。
空気で動く人工筋肉、自重の100倍を持ち上げるロボットへ——ASUの研究が示す「脱モーター」の現実味
アリゾナ州立大学の研究者たちは、空気で動く人工筋肉を開発し、ロボットが自分の体重の100倍を持ち上げる能力を持つことを目指しています。
ROSとLLMをつなぐ——ロボットが「言葉を理解して動く」ための本命フレームワークが登場
ロボットオペレーティングシステム(ROS)と大規模言語モデル(LLM)を統合した新しいフレームワークが提案され、ロボットが自然言語の指示を実行可能な行動に変換する能力を向上させることが期待されています。
ロボットが「代謝」する時代:自己修復・吸収・成長するロボットの現在地
コロンビア大学の研究者たちが、自己成長や自己修復が可能なロボット「Truss Link」を開発しました。これにより、ロボットは他のロボットから部品を吸収して形を変えることができます。
自律型手術ロボットが胆嚢摘出を100%成功——「監視なし手術」はもう絵空事じゃない
自律型ロボット外科医が100%の成功率で臓器を摘出する手術を行いました。ジョンズ・ホプキンズ大学の研究チームが開発したSRT-Hは、リアルタイムで学習し、適応する能力を持っています。
LLMベンチマーク21選を読み解く:「スコアが高い=使えるAI」ではない理由
この記事では、2026年4月時点での21種類のLLMベンチマークを解説し、各モデルの性能を評価するための指標を整理しています。
「速く作る」だけじゃない。PM/Dev/QAエージェントで保守性のあるMVPを作る方法
エージェント駆動開発は、PM、Dev、QAのAIエージェントを活用し、保守性を考慮したMVPを迅速に開発する手法です。
AIエージェントの「やった」じゃ済まない――行為を6分類して責任経路を守る
AIエージェントの行為を分類するためのAction Class Matrixを提案し、責任経路を維持する重要性を論じています。
デザイナーはAIエージェントに仕事を奪われるのか?現役フリーランサーの答え
デザイナーとAIエージェントの共生について、石田大顕がその役割や未来の方向性を考察しています。
AIにコードを書かせ続けると、3年後に何を失うか
AIに依存することで、エンジニアがコードを読む力や設計力を失いつつあるという警鐘を鳴らす記事です。
AIエージェント設計の「5つのパターン」を整理する——どれを使うかより、どう組み合わせるか
AIエージェントの設計パターンとして、ReAct、CodeAct、Agentic RAG、Self-Reflection、Multi-Agentの5つが紹介され、それぞれの役割や適用シーンが整理されています。
「Vibe Coding卒業」の意味——2026年のエンジニアに求められるのはAIが動ける環境を設計する力だ
2026年のエンジニアには、AIが動ける環境を設計する力が求められ、Vibe CodingからAgentic Engineeringへの移行が必要です。
SalesforceがUIを捨てた。Headless 360でClaude Codeが直接CRMを動かす時代の話
SalesforceがHeadless 360を発表し、ユーザーインターフェースを排除してAIエージェントが直接CRMを操作できるようになった。
ChatGPT-5.5時代、Codexに何を任せるか——「頼み方」の粒度が変わった
ChatGPT-5.5時代におけるCodexの役割と作業分担について解説しています。AIに任せる作業の粒度を見直し、効率的な開発プロセスを提案しています。
GPT-5.5が示す転換点:AIはもう「答える」だけじゃない
OpenAIはGPT-5.5を発表し、会話AIから実行AIへのシフトを強調しました。新モデルはコーディングや知識労働の効率を向上させ、実務における能力を重視しています。
AIエージェント時代、人間の仕事は「監視」から「仕組みを作ること」に移った
AIエージェントの進化に伴い、人間の役割や責任が変化していることを考察した記事です。