メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

【AI検索ランキング】Googleがトップ、OpenAI GPT-5は僅差の2位…ワシントン・ポスト調べ

竹内智子 アクセス  

引用:depositphotos*この画像は記事の内容と一切関係ありません
引用:depositphotos*この画像は記事の内容と一切関係ありません

主要な人工知能(AI)チャットボットの中で、検索ツールとして最も正確な情報を提供するのはグーグルの「AIモード」であることが明らかになった。これは、米国の有力紙ワシントン・ポストが司書の専門家と共に実施した比較実験の結果に基づいている。

今回のテストでは、グーグルのAIモードとAIオーバービュー、オープンAIのチャットGPT、Anthropicのクロード、メタAI、イーロン・マスク氏が設立したxAIのグロック、マイクロソフトのBing Copilot、検索に特化したAIサービスのPerplexityなど、計9種類のAI検索ツールが評価対象となった。チャットGPTについては、最新モデルのGPT-5とGPT-4 Turboの両方が評価に含まれた。

評価は2025年7月から8月にかけて、無料で提供される基本バージョンに限って実施された。質問は、クイズ形式の短答問題から時事ニュース、バイアスの判断、画像認識まで、実際の検索シーンを反映した5つのカテゴリーで構成された。各モデルは合計30問に対する900の回答を基に採点された。

結果、グーグルのAIモードが100点満点中60.2点を獲得し、首位に立った。チャットGPTのGPT-5モデルが55.1点で2位、Perplexityが51.3点で3位となった。一方、メタAIは33.7点と最低点を記録した。イーロン・マスクが開発したグロックシリーズのうち、テスト対象となったグロック3は40.1点で8位に留まり、最新モデルのグロック4は無料版がないため調査対象から除外された。

カテゴリー別では、グーグルのAIモードが最新トピックとクイズで優位性を示し、専門的な参考資料を求める質問ではBing Copilotが高評価を得た。Perplexityは画像分析で際立ち、GPT-4 Turboは比較的中立的で偏りの少ない回答を提供したと評価された。

ワシントン・ポストは、この実験を通じてAIシステムの限界も明確になったと指摘した。一部のAIは最新情報や情報源の信頼性を判断するのに苦戦し、誤った情報を自信を持って回答するケースもあった。結局、AIが提示する内容を鵜呑みにするのではなく、図書館司書のように情報源を検証し、批判的に考えることの重要性が実験の重要な示唆として残った。

このような傾向は、今後のAI検索技術の発展方向に大きな示唆を与える可能性がある。今後は情報の正確さだけでなく、信頼できる情報源に基づく文脈提供能力によって、AIシステム間の差異がより顕著になると予想される。

コメント0

300

コメント0

[トレンド] ランキング

  • 「自殺目的」は作り話だったのか…女子高生殺害の23歳男、検察が見抜いた“本当の狙い”
  • 妻と娘が中にいる家を掘削機で破壊…酔った男の「離婚なら家ごと壊す」実行犯
  • 深夜2時にマンホールから7人が出てきて素早く着替え…ブルックリンの謎の集団は何者か?
  • 「記録的な現象になる可能性がある」国連が警告する数週間以内の"スーパーエルニーニョ"
  • グーグル、“蚊3,200万匹の放出”を推進…一体何事!?
  • 「両腕を広げて抱きついてくる」…トルコの“ハグ猫”が話題に

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 「EUとの協力は重大な脅威だ!」アルメニアを追い詰めるプーチンの焦り
  • レアアース脱中国へ加速、代替磁石と新型モーター競争本格化
  • グーグル、“蚊3,200万匹の放出”を推進…一体何事!?
  • イランが米軍拠点攻撃主張、ホルムズ海峡巡り緊張再燃

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 「EUとの協力は重大な脅威だ!」アルメニアを追い詰めるプーチンの焦り
  • レアアース脱中国へ加速、代替磁石と新型モーター競争本格化
  • グーグル、“蚊3,200万匹の放出”を推進…一体何事!?
  • イランが米軍拠点攻撃主張、ホルムズ海峡巡り緊張再燃

おすすめニュース

  • 1
    スイス、9月に中立強化を問う国民投票実施へ…対ロ制裁への参加に反発

    ニュース 

  • 2
    トランプ政権「司法被害者基金」計画を撤回…連邦裁判所が相次ぎ停止命令

    ニュース 

  • 3
    AIブームでインフレ再燃懸念…FRBの利下げ遠のく

    ニュース 

  • 4
    ロシア、ウクライナに大規模夜間攻撃…11人死亡、111人負傷

    ニュース 

  • 5
    「頭頂部を高くすれば小顔で若く見える?」…頭皮を切開し穴まで開ける“頭の美容整形”に危険性の指摘も

    ヒント 

話題

  • 1
    ChatGPT登場後、新卒求人3割減…英若年層にAIの影響

    ニュース 

  • 2
    GMのAI革命「夜通し計算が1分に」…自動車開発の第3段階で業界の常識を覆す

    モビリティー 

  • 3
    中国、海外投資規制を強化…AI・先端技術の流出防止へ

    ニュース 

  • 4
    ソフトバンク孫会長「AI革命はドットコム時代の50倍規模」

    ニュース 

  • 5
    「月1万個の廃棄品を削減」日本自動車業界が不良品基準を大幅緩和、その背景とは

    モビリティー 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]