メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

【AI検索ランキング】Googleがトップ、OpenAI GPT-5は僅差の2位…ワシントン・ポスト調べ

竹内智子 アクセス  

引用:depositphotos*この画像は記事の内容と一切関係ありません
引用:depositphotos*この画像は記事の内容と一切関係ありません

主要な人工知能(AI)チャットボットの中で、検索ツールとして最も正確な情報を提供するのはグーグルの「AIモード」であることが明らかになった。これは、米国の有力紙ワシントン・ポストが司書の専門家と共に実施した比較実験の結果に基づいている。

今回のテストでは、グーグルのAIモードとAIオーバービュー、オープンAIのチャットGPT、Anthropicのクロード、メタAI、イーロン・マスク氏が設立したxAIのグロック、マイクロソフトのBing Copilot、検索に特化したAIサービスのPerplexityなど、計9種類のAI検索ツールが評価対象となった。チャットGPTについては、最新モデルのGPT-5とGPT-4 Turboの両方が評価に含まれた。

評価は2025年7月から8月にかけて、無料で提供される基本バージョンに限って実施された。質問は、クイズ形式の短答問題から時事ニュース、バイアスの判断、画像認識まで、実際の検索シーンを反映した5つのカテゴリーで構成された。各モデルは合計30問に対する900の回答を基に採点された。

結果、グーグルのAIモードが100点満点中60.2点を獲得し、首位に立った。チャットGPTのGPT-5モデルが55.1点で2位、Perplexityが51.3点で3位となった。一方、メタAIは33.7点と最低点を記録した。イーロン・マスクが開発したグロックシリーズのうち、テスト対象となったグロック3は40.1点で8位に留まり、最新モデルのグロック4は無料版がないため調査対象から除外された。

カテゴリー別では、グーグルのAIモードが最新トピックとクイズで優位性を示し、専門的な参考資料を求める質問ではBing Copilotが高評価を得た。Perplexityは画像分析で際立ち、GPT-4 Turboは比較的中立的で偏りの少ない回答を提供したと評価された。

ワシントン・ポストは、この実験を通じてAIシステムの限界も明確になったと指摘した。一部のAIは最新情報や情報源の信頼性を判断するのに苦戦し、誤った情報を自信を持って回答するケースもあった。結局、AIが提示する内容を鵜呑みにするのではなく、図書館司書のように情報源を検証し、批判的に考えることの重要性が実験の重要な示唆として残った。

このような傾向は、今後のAI検索技術の発展方向に大きな示唆を与える可能性がある。今後は情報の正確さだけでなく、信頼できる情報源に基づく文脈提供能力によって、AIシステム間の差異がより顕著になると予想される。

竹内智子
//= the_author_meta('email'); ?>editor@kangnamtimes.com

コメント0

300

コメント0

[トレンド] ランキング

  • 「給料は増えないのに、食費だけ高くなる」…食品2万品目値上げへ、家計直撃の現実
  • 「自殺目的」は作り話だったのか…女子高生殺害の23歳男、検察が見抜いた“本当の狙い”
  • 妻と娘が中にいる家を掘削機で破壊…酔った男の「離婚なら家ごと壊す」実行犯
  • 深夜2時にマンホールから7人が出てきて素早く着替え…ブルックリンの謎の集団は何者か?
  • 「記録的な現象になる可能性がある」国連が警告する数週間以内の"スーパーエルニーニョ"
  • グーグル、“蚊3,200万匹の放出”を推進…一体何事!?

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

おすすめニュース

  • 1
    中国EV、“冬の弱点”克服へ一歩か…BYDが極寒で見せた「12分で97%充電」

    モビリティー 

  • 2
    「レース中にエンジンごと替えろ!」トヨタの実戦開発哲学、ニュルで世界が目撃した

    モビリティー 

  • 3
    オレシュニクに誤作動疑惑、ロシア軍拠点を誤爆した可能性浮上

    ニュース 

  • 4
    外国人の不動産規制を見送った日本…「3%程度で、実態は不透明」

    ニュース 

  • 5
    「4WDは車を無敵にする魔法じゃない!」専門家が怒る、ドライバーの思い込みとその代償

    モビリティー 

話題

  • 1
    EU、「域外送還ハブ設置」の強硬な移民法に合意…外国人嫌悪論争も

    ニュース 

  • 2
    「カーナビ中に高温警告」スマホを車に繋ぐと熱くなる、Android Autoの落とし穴

    モビリティー 

  • 3
    「金持ちはさらに金持ちに」米国上位10%が全資産の68%保有、K字型経済の残酷な現実

    ニュース 

  • 4
    Amazon創業者ベゾス氏の“巨大ロケット”が発射台ごと爆発…「NASA月面計画」に暗雲

    ニュース 

  • 5
    「完璧な状態」とされたトランプ氏の健康診断…医療陣「重要な数値が抜けている」

    ニュース