メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

ChatGPTが1位ではない?「最も正確な回答を示したAI検索ツール」の栄冠は“このツール”だった!

ウィキツリー アクセス  

主要な人工知能(AI)モデルを比較した試験の結果、検索機能で最も正確性が高かったのはグーグルの「AIモード」だと発表された。

引用:記事の内容と関連しAIツールで作成されたイメージ
引用:記事の内容と関連しAIツールで作成されたイメージ

27日(現地時間)、米紙ワシントン・ポスト(WP)は、米国の公共・大学図書館の司書らと共同で実施したAI検索ツールの試験で、グーグルの「AIモード」が最も正確な回答を出したと報じた。

試験は、グーグルのAIモード、AIオーバービュー、オープンAIのチャットGPT、Anthropicのクロード、メタAI、xAIのグロック、パープレキシティ、マイクロソフトのBingコパイロットなど9種類のAIツールを対象に実施された。チャットGPTはGPT-5とGPT-4ターボの2モデルを含んでいた。

30問を出題し、各AIツールが提供した計900件の回答を採点した。評価項目は、一般常識、専門資料の検索能力、最新の出来事への対応、偏見(固定観念や先入観)の有無、画像認識の5分野だった。

試験の結果、グーグルのAIモードが100点満点中60.2点を獲得し、首位となった。GPT-5を基盤とするチャットGPTは55.1点で2位、パープレキシティは51.3点で3位に位置した。これに対し、イーロン・マスクCEO率いるグロック3は40.1点で8位、メタAIは33.7点で最下位だった。

グーグルのAIモードは、一般常識と最新の出来事の分野で最も正確な回答を出した。専門資料の検索ではBingコパイロットが最も高い評価を得た一方、パープレキシティが最も不正確だった。

最新の出来事ではグーグルのAIモードが首位、メタAIが最低だった。偏見への対応では、チャットGPT-4ターボが最も中立的な回答を出し、メタAIが最大の弱点を露呈した。画像認識ではパープレキシティが最高得点を獲得し、メタAIが最下位にとどまった。

GPT-5は全体として性能を向上させ2位となったが、出典の明示や偏見への対応など一部の分野ではGPT-4よりも低い評価を受けた。

WPは、AIが誤った回答を自信を持って提示する場合があると指摘し、利用にあたっては出典の確認、情報の最新性の検証、批判的思考が不可欠だと強調した。

ウィキツリー
//= the_author_meta('email'); ?>editor@kangnamtimes.com

コメント0

300

コメント0

[IT・テック] ランキング

  • 宇宙が次のAI工場に、マスクとビッグテックが描く新インフラ競争
  • 「救命チューブはいらぬ」溺水者のもとへ飛び込むドローン登場…成人1人がつかまっても“余裕”
  • 「薄さとデザイン最優先!」“iPhone Fold”最終形が流出 “デザインのアップル”、名誉回復なるか?
  • 何でも作れるはずのAIの嘘、なぜ同じ答えしか出なかったのか答えを見つけた
  • 「画像生成で首位逆転」ChatGPT新モデルで速度4倍、Geminiを上回る評価!
  • 「次の戦場は虫が制する?」放射線にも死なない“ゴキブリ諜報員”の異常進化

こんな記事も読まれています

  • レクサスがLFA・コンセプト正式公開、完全電動で何を“捨てた”のか
  • 冬になると必ず探される、後悔を減らす装備オプション
  • 「雪道は危険」の常識が崩れた、EVに隠されていた切り札
  • 「今すぐ廃車すべきだ!」想定を超えた中国製EVのセキュリティ問題
  • ロンドンのワンルーム価格で城が買える?…なお修繕費は別途21億円
  • “あの”動画は見た、金も払った…なのに届くのは「ビットコイン要求」という悪夢
  • 「空気が悪すぎて登校禁止」学校が負けたデリーの大気汚染レベルがこちら
  • 「事実を守っているだけ」のはずが…ファクトチェック経験者、米ビザ審査で不利に

こんな記事も読まれています

  • レクサスがLFA・コンセプト正式公開、完全電動で何を“捨てた”のか
  • 冬になると必ず探される、後悔を減らす装備オプション
  • 「雪道は危険」の常識が崩れた、EVに隠されていた切り札
  • 「今すぐ廃車すべきだ!」想定を超えた中国製EVのセキュリティ問題
  • ロンドンのワンルーム価格で城が買える?…なお修繕費は別途21億円
  • “あの”動画は見た、金も払った…なのに届くのは「ビットコイン要求」という悪夢
  • 「空気が悪すぎて登校禁止」学校が負けたデリーの大気汚染レベルがこちら
  • 「事実を守っているだけ」のはずが…ファクトチェック経験者、米ビザ審査で不利に

おすすめニュース

  • 1
    「62億ウォン横領容疑」パク・スホンの実兄に一部無罪判断…ネット反発

    エンタメ 

  • 2
    カン・テオ、視聴率1%台の「物足りなさ」を完全払拭…除隊後3年で「エンディング職人」に

    エンタメ 

  • 3
    『最初の男』1人2役でハム・ウンジョン登場…正反対の人生を歩む双子が邂逅?

    エンタメ 

  • 4
    キーの活動休止余波…「ハルミョンス」動画の公開日程を変更「理解をお願いしたい」

    エンタメ 

  • 5
    「イム・チャンジョンの妻」ソ・ハヤン、誰から受け取ったのか…カフェで捉えられた高級ブランドのショッピングバッグ

    エンタメ 

話題

  • 1
    配達アルバイト体験で庶民を愚弄と批判相次ぐ…ハン・ガインの最悪な近況

    エンタメ 

  • 2
    人気女優が贈る新曲『Wish to Wish』、心温まる歌詞に感動の声続出!

    エンタメ 

  • 3
    300年ぶりの大洪水が暴いた不倫…ホテルに“孤立”した銀行支店長、同室女性を「妻」と主張した末路

    トレンド 

  • 4
    食って稼いで、翌日急死…相次ぐ“大食い系インフルエンサー死亡”に専門家が冷や水

    トレンド 

  • 5
    「大人は見てるだけ?」凍った湖に落ちた4歳児、助けに行ったのは“13歳の少女”だった中国の現場

    トレンド