Skip to content
Close
馬場 高志2025/08/15 10:00:002 min read

OpenAI、GPT-5を発表:飛躍か、着実な進化か?|イノーバウィークリーAIインサイト -63

2025年8月7日(米国時間)、OpenAIは次世代大規模言語モデル「GPT-5」を発表しました。CEOのサム・アルトマンが2年近く言及してきたこともあり、業界の期待は最高潮。

しかし、発表後の評価は真っ二つに分かれています。「AGIへの大きな飛躍」と見る声もあれば、「期待ほどではない着実な進化」とする意見もあり、賛否が交錯しています。

 

本記事では、GPT-5がどのような進化を遂げ、なぜ評価が分かれているのかを、海外の専門家やメディアの分析をもとに多角的に検証します。性能の向上、新アーキテクチャ「ユニファイド・システム」の功罪、「ツールとともに考える」という新たな能力、さらに価格戦略や市場への影響まで、GPT-5の全貌に迫ります。

 

性能は向上、しかし革命ではない

まず、GPT-5の性能面での進化を見ていきます。結論から言えば、GPT-5は多くのベンチマークで既存のモデルを上回り、現時点で最高クラスの性能を持つモデルであることは間違いありません。

 

OpenAIの発表によると、GPT-5はコーディング能力を測る「SWE-bench Verified」で74.9%のスコアを記録し、AnthropicのClaude Opus 4.1(74.5%)やGoogleのGemini 2.5 Pro(59.6%)をわずかに上回りました。また、博士課程レベルの科学的問題を評価する「GPQA Diamond」でも、競合を上回るスコアを叩き出しています。

 

ユーザーの体感評価を基にした「LMArena」や総合ベンチマーク「ArtificialAnalysis」においても、GPT-5がトップの座を獲得しています。これは、GPT-5が単に特定のテストで強いだけでなく、幅広い実用シーンで高い能力を発揮することを示唆しています。

 

しかし、多くの専門家が口を揃えるのは、その性能向上が「革命的」というよりは「進化的」であるという点です。ソフトウェアエンジニアのサイモン・ウィリソン氏は、「以前のモデルからの劇的な飛躍ではない」としつつも、「有能さ」を感じさせ、滅多に失敗しない安定感を評価しています。AI研究者のネイサン・ランバート氏もこの見方に同意し、GPT-5はAIの性能トレンドラインに沿った「着実な一歩」であり、ステップチェンジ(段階的な大変化)ではないと分析しています。



統合システムとルーターの仕組み

GPT-5の最大の特徴は、新アーキテクチャ「ユニファイド・システム」の導入です。これは単一のモデルではなく、複数のモデルを統合し、ユーザーのプロンプトに応じて最適なモデルを自動選択する「ルーター」機能を備えています。

 

OpenAIによれば、このシステムは「ほとんどの質問に答えるスマートで高速なモデル」と「より難しい問題に対応する深い推論モデル」で構成されています。ユーザーが「もっと深く考えて」と指示した場合や、複雑なタスク・必要なツールに応じて、ルーターがモデルを使い分けます。

 

この仕組みにより、多くのユーザーはモデル選択を意識せずに最適な性能を享受できます。さらに、コスト効率も改善され、後述する低価格戦略の一因となっています。

 

一方で、この「おまかせ」機能には課題もあります。最大の論争となったのは、GPT-5のリリースと同時に、それまで多くのユーザーに愛用されていた旧モデル「GPT-4o」へのアクセスが突然終了したことです。GPT-4oは、複雑な推論やコーディングよりも、感情表現やロールプレイ、創造的な文章生成に優れており、特定のクリエイティブ用途で根強い人気がありました。そのため、告知なしの終了はSNSやフォーラムで強い反発を招き、最終的にOpenAIは有料ユーザー向けにアクセスを復活させる措置を取らざるを得ませんでした。

 

また、モデル選択をAI側が自動的に行うことによる弊害も指摘されています。同じプロンプトを入力しても、AIが「簡単なタスク」と判断すれば高速だが簡易的なモデルが応答し、「難しいタスク」と判断すれば時間がかかるが高品質なモデルが応答するため、出力結果の内容や品質が一定せず、予測が難しくなるのです。特に、厳密な再現性が求められる研究や開発現場では、この挙動が混乱の原因となる可能性があります。

 

ツールを駆使する自律性の進化

GPT-5の真価は、ベンチマークスコア以上に「エージェント」としての自律性にあります。専門家はこれを「ツールとともに考える能力」と呼び、AIがツールを単に利用するのではなく、思考プロセスに統合して活用していると指摘します。

 

たとえば、以前のモデル「o3」で実装されたDeep Research機能は、計画→検索→結果吟味→思考深化というプロセスを繰り返していました。GPT-5はこの能力をあらゆるツールに拡張しています。

 

AI協働の専門家であるイーサン・モリック准教授は、曖昧な指示だけでGPT-5が3D都市ビルダーを構築し、追加指示で自動的に新機能まで実装した事例を紹介しています。また、他の専門家も、わずかなプロンプトでユーザー専用の予算管理アプリなどが作成できることを例に挙げ、誰でもコーディングの知識なしに、オンデマンドでカスタムソフトを作れる時代が来たと述べています。

 

こうした変化は、プロンプトの書き方やモデル利用の設計思想そのものを見直す必要性を示しています。従来は、細かくプロンプトを調整する「プロンプトエンジニアリング」が重視されていましたが、今後はAIに最終判断を委ねつつ、意図が正しく伝わるように大枠の指示を与えるスタイルへと移行していくかもしれません。その結果、ユーザーと開発者の境界はさらに曖昧になり、誰もが直感的に高度なアプリケーションを構築できる時代が加速する可能性があります。

 

ハルシネーションを大幅削減

AIの能力がどれだけ向上しても、その信頼性が低ければ実用は困難です。特に、AIが事実に基づかない情報をあたかも真実であるかのように生成する「ハルシネーション(幻覚)」は、長年の課題でした。この点において、GPT-5は特筆すべき改善を達成しており、一部の専門家はこれを最も重要な進歩だと評価しています。

 

OpenAIが公開したデータによると、GPT-5(思考モード利用時)のハルシネーション発生率は、一般的なチャットにおいてo3の22%から4.8%へと、実に65%も削減されました。また、GPT-4oの20.6%と比較しても大幅な改善が見られます。さらに、AIができないことを「できる」と偽るような「欺瞞」の発生率も、o3の4.8%から2.1%に半減しています。

 

OpenAIは、「Safe-Completions (安全な回答)」という新たな安全トレーニングアプローチを導入しました。これは、ユーザーのクエリを危険な用途と機械的に分類して応答を拒否するのではなく、安全ポリシーの制約内で最大限の有用性を提供することを目指すものです。

これにより、単なる応答拒否ではなく、有害な内容を避けつつも、より穏当で安全な回答を提供するようになっています。

 

これらの改善は、AIがより信頼できるパートナーとして、医療や研究、コーディング支援といった実世界のリスクを伴うタスクで活用されるための重要な基盤となります。ベンチマークのスコアのような華やかさはありませんが、AIの「能力の底上げ」は、その社会実装を加速させる上で不可欠な進歩と言えるでしょう。

 

低価格戦略がもたらす市場の波紋

GPT-5の発表で業界に衝撃を与えたもう一つの要素は、そのアグレッシブな価格設定です。OpenAIは、フラッグシップモデルであるGPT-5のAPI価格を、100万入力トークンあたり1.25ドル、100万出力トークンあたり10ドルに設定しました。

 

これは、競合であるAnthropicの最上位モデルClaude Opus 4.1(入力15ドル、出力75ドル)を劇的に下回る価格です。また、コーディング用途で人気のGoogleのGemini 2.5 Proとほぼ同等の価格帯でありながら、大量利用時の追加料金がない点で優位に立っています。この価格は前世代のGPT-4oよりも安価です。

 

この価格戦略は、AI市場における価格競争を激化させる引き金となる可能性があります。これまでAIモデルの利用コストは、多くのスタートアップや開発者にとって大きな負担となっていました。GPT-5の低価格化は、AIを活用した新しいアプリケーションやサービスの開発を促進し、AI導入の裾野を広げる効果が期待されます。

 

OpenAIは、最新・最高のモデルを無料で提供し、APIを低価格で提供することで、コンシューマー市場と開発者市場の両方でそのリードを盤石なものにしようとしています。特に、API収入への依存度が高いAnthropicのような競合にとっては、深刻な脅威となるでしょう。ネイサン・ランバート氏は、この動きがAI業界の資金調達にも影響を与え、AGIといった華やかなストーリー性よりも、実際の製品価値の提供へのプレッシャーが高まる可能性があると指摘しています。

 

おわりに:進化と期待のギャップ、そしてAGIへの現実的な視点

OpenAIのGPT-5は、AGIの実現を待ち望んでいた人々にとっては、やや肩透かしと感じられたかもしれません。しかし、その実態は単なる着実な進化にとどまらず、複数の重要な前進を組み合わせた成果です。

 

新アーキテクチャ「統合システム」とルーター機能は、AIをより多くの人にとって使いやすく、かつコスト効率の高い存在にしました。ハルシネーションの大幅削減は信頼性を高め、実社会での応用を加速させる重要な土台となります。そして、「ツールを駆使して考える」という新たな自律性は、AIを単なる文章生成から自律的なタスク遂行エージェントへと押し上げました。

 

GPT-5は「革命」ではなく「進化」の産物です。しかし、その進化は、人とAIの関係性、ソフトウェア開発のあり方、そしてビジネス競争環境を着実に変えていく力を持っています。AGIへの道のりは依然として長いかもしれませんが、GPT-5はその道の上に確かな足跡を刻んだと言えるでしょう。

 

▼参考記事

 


avatar

馬場 高志

1982年に富士通に入社、シリコンバレーに通算9年駐在し、マーケティング、海外IT企業との提携、子会社経営管理などの業務に携わったほか、本社でIR(投資家向け広報)を担当した。現在はフリーランスで、海外のテクノロジーとビジネスの最新動向について調査、情報発信を行っている。 早稲田大学政経学部卒業。ペンシルバニア大学ウォートン校MBA(ファイナンス専攻)。