前倒し発表の裏で「偽ベンチマーク」騒動も浮上

米ChatGPTの開発会社OpenAIが、「コードレッド」を敷いてまで準備してきた次世代モデルの公開が、結局見送られた。Googleの最新AIモデル「Gemini(ジェミニ)3」が圧倒的な性能を示し、対抗するため予定を前倒しして巻き返しを図ったものの、技術的問題やサーバー容量不足といった現実的な壁に突き当たったためだ。3年前、ChatGPTでAI革命を牽引したOpenAIが、いまやGoogleを必死に追う「追撃者」へ転じたとの評価も広がっている。
9日(現地時間)、米IT専門メディア「ザ・ヴァージ(The Verge)」などによれば、OpenAIは同日発表を予定していた次世代モデル「GPT-5.2(コードネーム:Garlic)」の公開を延期した。当初、サム・アルトマンCEOは1日、Gemini3が市場予想を上回る性能を示したことを受け、社内に「コードレッド」を発令。さらに、同社が進めていたショッピングやヘルスケア向けAIエージェント、ChatGPT検索広告事業など、収益化関連の新規プロジェクトを一時停止するという異例の決断を下した。全リソースを新モデル開発に投入し、今月中に勝負をかける構えだった。
しかし、最終段階の最適化プロセスで発生した問題が足を引っ張ったとされる。業界関係者によると、GPT-5.2は最終テストで予期せぬ技術的エラーが確認され、稼働に必要な大規模サーバーの確保でも支障が出たという。米紙「ウォール・ストリート・ジャーナル(WSJ)」は「新モデル『Garlic』の公開は来年1月になる見通しだ」と報じた。
LinkedInで「偽ベンチマーク」疑惑が浮上
業界では、最近浮上した「偽ベンチマーク(AI性能指標)流出騒動」も公開延期に影響した可能性があるとの見方もある。OpenAIのマーク・チェン最高研究責任者は先週の内部ブリーフィングで、「GPT-5.2はコーディングと推論性能で、GoogleのGemini3やAnthropic(アンソロピック)のClaude Opus 4.5を上回った」と説明。アルトマンCEOも内部メモで同様の評価を示し、社員を鼓舞した。
ところが、6日「X」や「Reddit」上に流出した「GPT-5.2ベンチマーク資料」が偽物ではないかとの疑いが強まった。AI業界関係者らはSNS「LinkedIn」で「Gemini3のスコアをそのままコピーし改ざんした資料だ」と指摘。この資料は過去にも虚偽情報を流したことがあるソースから拡散されたものとされる。
一方、巨額の赤字を抱えながら巨額のAI投資を続けてきたOpenAIは、収益化に向けた体制整備を加速している。「WSJ」などによれば同社は最近、業務用メッセンジャー「スラック(Slack)」の元CEOであるデニス・ドレッサー氏を新たな最高売上責任者(CRO)に起用した。技術開発はアルトマン氏が主導しつつ、企業顧客の獲得や収益モデルの強化は経験豊富な経営者に委ね、突破口を開く狙いがあるとみられる。













コメント0