AI 2026年4月22日

OpenAIが創薬AIに本気を出した：GPT-Rosalindが生命科学研究に与えるインパクト

OpenAIが汎用路線から踏み出した

2026年4月17日、OpenAIはライフサイエンス分野に特化した推論AIモデル「GPT-Rosalind」をリリースした。OpenAIが特定の研究ドメインに絞り込んだモデルを出すのはこれが初めてだ。

モデル名はRosalind Franklin（1920–1958）に由来する。X線結晶学によってDNAの二重らせん構造の解明に貢献した英国人化学者だ。「DNAの構造解析が現代分子生物学の礎になったように、このモデルが生命科学研究の基盤となることへの期待」という命名理由は、少々クサいが方向性はわかりやすい。

なぜ今、ドメイン特化型なのか

ここが面白いポイントだと思う。OpenAI自身が、汎用LLMには限界があると認めた形になっているからだ。

公式の説明によれば、「従来の汎用LLMは科学文献の要約や基礎的な生物学の説明は得意だが、ゲノム配列解析・実験プロトコル設計・特定の生物学的データベースへのアクセスには限界があった」とされている。GPT-4系が散々「科学研究を支援できる」と謳われてきた経緯を考えると、これはそれなりに率直な自己評価だ。

もう一つの背景として、創薬の現実がある。標的探索から規制当局の承認まで通常10〜15年を要するとOpenAIは発表の中で触れている。AIで短縮できる余地が大きい領域として、製薬・バイオテック企業からの需要は明確に存在する。

数字で見る実力

公開されているベンチマーク結果を整理しておく。

BixBench（実世界のバイオインフォマティクスタスクを評価するベンチマーク）では、GPT-Rosalindは0.751のpass rateを記録。公開済みモデルの中で最高スコアとされている。ゲノム配列解析、タンパク質機能予測、RNA解析など、実際の研究シーンを模したタスクで計測されたものだ。

LABBench2では11タスク中6タスクでGPT-5.4を上回った。特に「CloningQA」（分子クローニングプロトコルの試薬設計タスク）ではすべての比較モデルを超えたとされる。

最も印象的な数字はDyno Therapeuticsによる未公開RNA配列を使った評価だ。「配列→機能予測」でヒト専門家の95パーセンタイル相当、「配列生成」で84パーセンタイル相当のスコアを出している。未公開データを使っている点は重要で、ベンチマーク汚染の心配が少ない評価として参照価値が高い。

ただし留保も付けておく。BixBenchもLABBench2も、評価の選定はOpenAI自身が行っている。第三者による独立した評価はまだ限られており、数字をそのまま鵜呑みにするのは早計だ。

他のアプローチとの比較も整理しておくと、Google DeepMindのAlphaFold 3はタンパク質・核酸・低分子の「構造予測」に特化、Arc InstituteのEvo 2はDNA配列の「生成・解析」に特化している。GPT-Rosalindは「研究者が自然言語で対話しながら複数ステップの研究タスクを進める」インターフェースとしての役割が強い。構造予測ツールを作ったというより、研究者のAIアシスタントを作った、と理解するほうが実態に近い。

AIおじさんの見方

個人的に注目しているのは、バイオセキュリティへの対応を設計段階から組み込んでいる点だ。Trusted Access Programのアクセス制限は、単なるマーケティング上の「選ばれた感」ではなく、生命科学AI技術の悪用リスクを明示的に低減するための措置だとOpenAIは説明している。

これは見方を変えると、OpenAIが「このモデルは使い方次第でリスクになりうる」と自己認識しているということでもある。汎用モデルにはなかった緊張感が、ドメイン特化モデルには伴う。その緊張感を正面から取り扱っているのは、一定の誠実さだと思う。

ローンチパートナーにAmgen、Moderna、Allen Institute、Thermo Fisher Scientificが名を連ねている点も見逃せない。特にコロナワクチンで日本でも有名になったModernaはmRNA医薬品でAI活用に積極的な企業であり、評価の場として意味のある選択だ。