生成AIニュース
30 件
PoCは動く、本番は壊れる──9社のAIエージェント運用から見えた「評価と観測」という共通の壁
AIエージェントの開発に関する特集記事で、9社の技術選定や運用の課題と解決策が紹介されています。
Anthropicが国防総省と決裂した本当の理由——「完全自律型兵器」をめぐる構造的な断絶
AI技術の進展により、自律型兵器の開発が進んでいる中、Anthropicと国防総省の間での契約交渉が破綻し、AI兵器の倫理的リスクが浮き彫りになっています。
「100兆円市場」を狙う日立×Anthropicの本気度——フィジカルAIで日本企業が勝てる理由と、まだ見えない課題
日立が米Anthropicと提携し、フィジカルAI市場での競争力を強化する戦略を発表。100兆円規模の市場を狙い、AI技術を活用した社会インフラの革新を目指す。
AIが1秒で作るノイズを、人間が数日かけて処理する構造——「ミトス問題」が教える工数崩壊のリアル
元Yahoo!エンジニアの山田健太郎が、AIスクリーニングによる工数崩壊の問題とその対策を考察しています。
Gemini 3.5 Flashが示す転換点——GoogleはAIを「話す道具」から「働く主体」へ変えようとしている
Googleは、最強のAIモデルGemini 3.5 Flashを発表し、AIを会話ツールからエージェントツールへとシフトさせることを目指しています。
生成AIのリスクは「出力」より「入力」にある——権利・機密・心理的反発を実務で整理する
生成AIの利用には、権利や機密情報、品質、心理的反発といったリスクが存在し、それらを適切に管理することが求められています。
AI生成コードを「本番品質」に仕上げる5つのレビュー基準——14日デプロイの現場から
AI生成コードを本番品質にするための5つのレビュー基準を紹介する記事です。
AIエージェントにコードを書かせるとき、あなたはどこまで「信頼」しているか
生成AIを用いたソフトウェア開発におけるセキュリティの問題点を整理し、AIエージェントの権限拡大や脆弱性について考察しています。
CopilotのUI刷新が意味するのは「AI導入」ではなく「業務設計の前提変更」だ
Microsoft 365のCopilotがAI機能を統合し、業務プロセス設計を根本から変える方向に進化した。
Physical AIは本当にソフトウェアエンジニアの次の戦場か?2026年の現実を整理する
2026年、Physical AIがソフトウェアエンジニアの新たな戦場となる理由を探る記事です。ヒューマノイドロボットの進化とソフトウェアスタックの標準化が鍵となります。
Claude Code・Cursor・Codex、3ヶ月使い倒してわかった「正しい使い分け」の話
Claude Code、Codex、Cursorの3つのAIコーディングツールの使い分けについて、実務での経験を基にした具体的なガイドラインを提供しています。
AIコーディングは「プロンプト職人」を目指すと負ける。「仮想開発組織」を作る発想に切り替えよ
AIコーディングの本質は、プロンプトに依存するのではなく、仮想開発組織を構築することにあると論じています。
「AIがAIを作る」時代が来た。OpenAIとAnthropicが警告するRSIの現実
OpenAIとAnthropicの研究者たちは、再帰的自己改善(RSI)が現実化しつつあり、AIの進化が人間の理解を超える可能性があると警告しています。
AIを「一つの正解」に収束させるのは本当に安全か? 境界情報幾何学(BIG)が問うアライメントの盲点
この記事では、AIアライメントにおける「認知的単一化」のリスクと、境界情報幾何学(BIG)の概念を通じて知性の多様性を維持する方法について論じています。
「世界モデル」がAI開発の本命になりつつある理由——LLMの脆弱さと、その先にあるもの
世界モデルはAIが物理的現実を理解し、行動の結果を予測するための重要な技術として注目されています。
AIブームの「5つの危険信号」を読み解く——楽観論だけで動くと見えないリスクがある
AI業界の成長の裏で、5つの危険信号が浮上している。これらは業界の構造的脆弱性を示しており、特にインフラ投資や企業の信頼性に影響を及ぼす可能性がある。
同じ質問を5回投げたら5つの別回答が返ってきた——LLMが嘘をつく「仕様」を理解する
同じ質問に対して異なる回答が得られる理由を探る実験を通じて、LLMの設計に起因する構造的な問題が明らかになりました。
ロボタクシーの安全性をNVIDIAが本気で作り込む:OpenUSDとHalosが変える自律走行の現実
NVIDIAはOpenUSDとHalosフレームワークを活用し、ロボタクシーや物理AIシステムの安全性を向上させるための新しいワークフローを提供しています。
ROSとLLMをつなぐ——ロボットが「言葉を理解して動く」ための本命フレームワークが登場
ロボットオペレーティングシステム(ROS)と大規模言語モデル(LLM)を統合した新しいフレームワークが提案され、ロボットが自然言語の指示を実行可能な行動に変換する能力を向上させることが期待されています。
LLMベンチマーク21選を読み解く:「スコアが高い=使えるAI」ではない理由
この記事では、2026年4月時点での21種類のLLMベンチマークを解説し、各モデルの性能を評価するための指標を整理しています。
「速く作る」だけじゃない。PM/Dev/QAエージェントで保守性のあるMVPを作る方法
エージェント駆動開発は、PM、Dev、QAのAIエージェントを活用し、保守性を考慮したMVPを迅速に開発する手法です。
AIエージェントの「やった」じゃ済まない――行為を6分類して責任経路を守る
AIエージェントの行為を分類するためのAction Class Matrixを提案し、責任経路を維持する重要性を論じています。
デザイナーはAIエージェントに仕事を奪われるのか?現役フリーランサーの答え
デザイナーとAIエージェントの共生について、石田大顕がその役割や未来の方向性を考察しています。
AIにコードを書かせ続けると、3年後に何を失うか
AIに依存することで、エンジニアがコードを読む力や設計力を失いつつあるという警鐘を鳴らす記事です。
AIエージェント設計の「5つのパターン」を整理する——どれを使うかより、どう組み合わせるか
AIエージェントの設計パターンとして、ReAct、CodeAct、Agentic RAG、Self-Reflection、Multi-Agentの5つが紹介され、それぞれの役割や適用シーンが整理されています。
「Vibe Coding卒業」の意味——2026年のエンジニアに求められるのはAIが動ける環境を設計する力だ
2026年のエンジニアには、AIが動ける環境を設計する力が求められ、Vibe CodingからAgentic Engineeringへの移行が必要です。
SalesforceがUIを捨てた。Headless 360でClaude Codeが直接CRMを動かす時代の話
SalesforceがHeadless 360を発表し、ユーザーインターフェースを排除してAIエージェントが直接CRMを操作できるようになった。
ChatGPT-5.5時代、Codexに何を任せるか——「頼み方」の粒度が変わった
ChatGPT-5.5時代におけるCodexの役割と作業分担について解説しています。AIに任せる作業の粒度を見直し、効率的な開発プロセスを提案しています。
GPT-5.5が示す転換点:AIはもう「答える」だけじゃない
OpenAIはGPT-5.5を発表し、会話AIから実行AIへのシフトを強調しました。新モデルはコーディングや知識労働の効率を向上させ、実務における能力を重視しています。
AIエージェント時代、人間の仕事は「監視」から「仕組みを作ること」に移った
AIエージェントの進化に伴い、人間の役割や責任が変化していることを考察した記事です。