
グーグルが先週末に公開した新型人工知能(AI)「Gemini 3」が、各種ベンチマークテストでChatGPTなどの競合を上回り、最も優れた性能を示したと、米紙『ウォール・ストリート・ジャーナル』(WSJ)が報じた。
クラウドコンテンツ管理会社「Box」のアーロン・レヴィ最高経営責任者(CEO)は先週末、発売前のGemini 3のアクセス権を取得し、その性能を評価した。評価は、複雑かつ大量の文書をGemini 3がどれだけ正確に分析できるかを確認する内容であった。
レヴィCEOは「最初は『何か間違っているのではないか』と思った。性能の向上幅があまりにも大きかった」と述べた。
今週公開されたGemini 3については、多くの専門家やユーザーがその知能、正確性、創造力を高く評価している。特にGemini 3は、複数の知能カテゴリを評価する12以上のベンチマークテストで競合モデルを上回る成績を示した。調査会社「モフェット・ナサンソン」のアナリスト、マイケル・ネイサンソン氏は「グーグルが明らかにAIの勝者だ」と述べた。
現在、最も人気のあるAIはChatGPTで、OpenAIによると今月の週次ユーザー数は8億人に達する。一方、Geminiの月間ユーザー数は6億5,000万人である。コーディング分野では、アンソロピック(Anthropic)社の「クロード」が最も優れているとの評価を受けている。
しかし、Gemini 3は技術的に大きな飛躍を遂げ、さまざまな分野で最も利用されるツールとしての地位を確立する可能性があると評価されている。
グーグルはGemini 3の開発にあたり、AIの中でも特に難易度の高い領域を克服することに重点を置いた。開発チームは、テキスト、画像、音声、映像、コードなどあらゆる形式のコンテンツを理解し、分析・生成する能力を高めることに注力した。特にコーディング分野での性能向上を目指し、思考力や推論力の強化にも取り組んだという。
Gemini 3の発売後、20種類のベンチマークテストでのスコアをまとめた表がオンライン上で拡散した。
専門家の知識、論理パズル、数学問題、画像認識などを対象とした試験では、最新のChatGPTやAnthropic社のモデルを大きく上回った。コーディング関連の単一ベンチマークでは、Anthropicの「Claude Sonnet 4.5」に次ぐ2位を記録した。
グーグルの製品管理担当シニアディレクター、トゥルシー・ドーシ氏は、「ベンディングベンチ」での高い成果が最も驚くべき点だと述べた。
「ベンディングベンチテスト」は、AIが自動販売機を運営するかのように設定され、限られた時間内で思考し、行動する能力を評価する方式である。AIは在庫管理、発注、価格設定をシミュレーション上で行い、利益を上げなければ高評価は得られない。
グーグルはGemini 3を発売初日から検索に統合した。新モデルを発売初日から検索サービスに組み込むのは今回が初めてである。
グーグルの検索製品担当副社長であるロビー・スタイン氏は、7歳の娘に飛行機の揚力の概念を説明するためにGemini 3を活用した。スタイン氏は文章での説明を想定していたが、Gemini 3は翼の上を流れる気流のインタラクティブなシミュレーションを表示し、翼の角度や気流を調整して飛行機が飛ぶ過程を実演できるようにした。
スタイン氏は「質問に最も適切に答える方法だと感じた」と述べ、Gemini 3の活用で娘に理解させることが可能であるという確信を持てたと明らかにした。
グーグルは3年前にChatGPTが登場して以来、AI競争で後れを取り、AI戦略の再編成を進めてきた。セルゲイ・ブリン共同創業者もAI開発を監督するため、再び会社の日常業務に復帰した。
同社は昨年5月の年次開発者会議で、AIモードを統合した新しい検索エンジンを発表した。AIモードでは、検索クエリに対してチャットボット形式で回答する機能が提供される。これを契機に、ウォール街の投資家たちはグーグルに対する信頼を徐々に回復し始めた。
8月には画像生成AI「ナノバナナ」を公開し、Geminiの月間ユーザーは7月の4億5,000万人から6億5,000万人へと急増した。
9月には連邦裁判所がグーグルの検索市場独占を違法と認定したものの、市場競争の構図はすでにAIによって変化しているとして、処罰は緩和された。その結果、グーグルの親会社「アルファベット」は先月の四半期決算で売上の新記録を達成した。
今年、グーグルの株価は50パーセント以上上昇し、夏以降では60パーセントを超える伸びを示した。今週の時価総額は約3兆6,000億ドル(約560兆円)となり、7年ぶりにマイクロソフトを上回った。













コメント0