OpenAIが汎用路線から踏み出した
2026年4月17日、OpenAIはライフサイエンス分野に特化した推論AIモデル「GPT-Rosalind」をリリースした。OpenAIが特定の研究ドメインに絞り込んだモデルを出すのはこれが初めてだ。
モデル名はRosalind Franklin(1920–1958)に由来する。X線結晶学によってDNAの二重らせん構造の解明に貢献した英国人化学者だ。「DNAの構造解析が現代分子生物学の礎になったように、このモデルが生命科学研究の基盤となることへの期待」という命名理由は、少々クサいが方向性はわかりやすい。
なぜ今、ドメイン特化型なのか
ここが面白いポイントだと思う。OpenAI自身が、汎用LLMには限界があると認めた形になっているからだ。
公式の説明によれば、「従来の汎用LLMは科学文献の要約や基礎的な生物学の説明は得意だが、ゲノム配列解析・実験プロトコル設計・特定の生物学的データベースへのアクセスには限界があった」とされている。GPT-4系が散々「科学研究を支援できる」と謳われてきた経緯を考えると、これはそれなりに率直な自己評価だ。
もう一つの背景として、創薬の現実がある。標的探索から規制当局の承認まで通常10〜15年を要するとOpenAIは発表の中で触れている。AIで短縮できる余地が大きい領域として、製薬・バイオテック企業からの需要は明確に存在する。
数字で見る実力
公開されているベンチマーク結果を整理しておく。
BixBench(実世界のバイオインフォマティクスタスクを評価するベンチマーク)では、GPT-Rosalindは0.751のpass rateを記録。公開済みモデルの中で最高スコアとされている。ゲノム配列解析、タンパク質機能予測、RNA解析など、実際の研究シーンを模したタスクで計測されたものだ。
LABBench2では11タスク中6タスクでGPT-5.4を上回った。特に「CloningQA」(分子クローニングプロトコルの試薬設計タスク)ではすべての比較モデルを超えたとされる。
最も印象的な数字はDyno Therapeuticsによる未公開RNA配列を使った評価だ。「配列→機能予測」でヒト専門家の95パーセンタイル相当、「配列生成」で84パーセンタイル相当のスコアを出している。未公開データを使っている点は重要で、ベンチマーク汚染の心配が少ない評価として参照価値が高い。
ただし留保も付けておく。BixBenchもLABBench2も、評価の選定はOpenAI自身が行っている。第三者による独立した評価はまだ限られており、数字をそのまま鵜呑みにするのは早計だ。
他のアプローチとの比較も整理しておくと、Google DeepMindのAlphaFold 3はタンパク質・核酸・低分子の「構造予測」に特化、Arc InstituteのEvo 2はDNA配列の「生成・解析」に特化している。GPT-Rosalindは「研究者が自然言語で対話しながら複数ステップの研究タスクを進める」インターフェースとしての役割が強い。構造予測ツールを作ったというより、研究者のAIアシスタントを作った、と理解するほうが実態に近い。
AIおじさんの見方
個人的に注目しているのは、バイオセキュリティへの対応を設計段階から組み込んでいる点だ。Trusted Access Programのアクセス制限は、単なるマーケティング上の「選ばれた感」ではなく、生命科学AI技術の悪用リスクを明示的に低減するための措置だとOpenAIは説明している。
これは見方を変えると、OpenAIが「このモデルは使い方次第でリスクになりうる」と自己認識しているということでもある。汎用モデルにはなかった緊張感が、ドメイン特化モデルには伴う。その緊張感を正面から取り扱っているのは、一定の誠実さだと思う。
ローンチパートナーにAmgen、Moderna、Allen Institute、Thermo Fisher Scientificが名を連ねている点も見逃せない。特にコロナワクチンで日本でも有名になったModernaはmRNA医薬品でAI活用に積極的な企業であり、評価の場として意味のある選択だ。
実務的な視点:誰が今すぐ動けるか
GPT-Rosalind本体は現状、米国の選定されたエンタープライズ向けResearch Previewだ。日本の研究者や開発者がすぐ使えるものではない。プレビュー期間中はAPIクレジットを消費しないとされているが、そもそもアクセスできる対象が限られている。
一方、Codex Life Sciences Pluginは無償で提供されている。50以上の科学データベース・計算ツールへのアクセス、文献検索、分子設計ツールとの統合などが含まれる。Codexおよび OpenAI API経由で研究プレビューとして利用できる状態だ。
ライフサイエンス系の開発者・研究者がまず試せるのはこちらになる。GPT-Rosalind本体へのアクセスを待ちながら、プラグインで開発フローを試しておくというのが現実的な動き方だろう。
まとめ
GPT-Rosalindは「OpenAIがついに汎用路線の限界を認め、ドメイン特化に踏み込んだ」という意味で節目のモデルだ。BixBench 0.751、RNA予測でヒト専門家の95パーセンタイルという数字は、少なくともベンチマーク上は説得力がある。
日本の研究者・開発者が直接触れられるのはまだ先の話だが、Codex Life Sciences Pluginは今すぐ使える。創薬やゲノム研究にAIを絡めた仕事をしている人は、このプラグインの動向を追っておいて損はない。
AIの専門化が進む流れの中で、「何でもできる汎用モデル」と「特定領域で深く使えるドメインモデル」の両立がどう実現されていくか——GPT-Rosalindはその実験台の一つでもある。