メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

ChatGPTが1位ではない?「最も正確な回答を示したAI検索ツール」の栄冠は“このツール”だった!

ウィキツリー アクセス  

主要な人工知能(AI)モデルを比較した試験の結果、検索機能で最も正確性が高かったのはグーグルの「AIモード」だと発表された。

引用:記事の内容と関連しAIツールで作成されたイメージ
引用:記事の内容と関連しAIツールで作成されたイメージ

27日(現地時間)、米紙ワシントン・ポスト(WP)は、米国の公共・大学図書館の司書らと共同で実施したAI検索ツールの試験で、グーグルの「AIモード」が最も正確な回答を出したと報じた。

試験は、グーグルのAIモード、AIオーバービュー、オープンAIのチャットGPT、Anthropicのクロード、メタAI、xAIのグロック、パープレキシティ、マイクロソフトのBingコパイロットなど9種類のAIツールを対象に実施された。チャットGPTはGPT-5とGPT-4ターボの2モデルを含んでいた。

30問を出題し、各AIツールが提供した計900件の回答を採点した。評価項目は、一般常識、専門資料の検索能力、最新の出来事への対応、偏見(固定観念や先入観)の有無、画像認識の5分野だった。

試験の結果、グーグルのAIモードが100点満点中60.2点を獲得し、首位となった。GPT-5を基盤とするチャットGPTは55.1点で2位、パープレキシティは51.3点で3位に位置した。これに対し、イーロン・マスクCEO率いるグロック3は40.1点で8位、メタAIは33.7点で最下位だった。

グーグルのAIモードは、一般常識と最新の出来事の分野で最も正確な回答を出した。専門資料の検索ではBingコパイロットが最も高い評価を得た一方、パープレキシティが最も不正確だった。

最新の出来事ではグーグルのAIモードが首位、メタAIが最低だった。偏見への対応では、チャットGPT-4ターボが最も中立的な回答を出し、メタAIが最大の弱点を露呈した。画像認識ではパープレキシティが最高得点を獲得し、メタAIが最下位にとどまった。

GPT-5は全体として性能を向上させ2位となったが、出典の明示や偏見への対応など一部の分野ではGPT-4よりも低い評価を受けた。

WPは、AIが誤った回答を自信を持って提示する場合があると指摘し、利用にあたっては出典の確認、情報の最新性の検証、批判的思考が不可欠だと強調した。

コメント0

300

コメント0

[IT・テック] ランキング

  • ブラック派がついに揺れるのか…iPhone18 Pro新色「ダークチェリー」に早くも本命説
  • 中国で世界初のロボット学校が開校…「ヒューマノイドも学校へ行く時代」に
  • 「AIバブルか、本物か」…孫正義がフランスに約13兆円を投じる“巨大計画”
  • AIデータセンターは本当に“電気を食う施設”なのか…米軍元中将が語った意外な役割
  • 「AIリストラ」は本当に避けられないのか…半導体王が経営者の“言い訳”を一刀両断
  • 「パスワードはもう危ない」…英情報トップが警告した中露スパイ戦の“次の標的”

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

おすすめニュース

  • 1
    ポールスター5、884PSでタイカンの牙城に挑む 北欧の新星は"本物"か?

    モビリティー 

  • 2
    ホンダ系ディーラー、下請け整備業者に車両運搬を無償強要…公取委が勧告方針

    モビリティー 

  • 3
    「人間が作り出した突然変異」倫理なき近親交配で生まれたホワイトタイガーの衝撃的な姿

    トレンド 

  • 4
    店先で盲導犬がおしっこをしてしまった瞬間、店主が見せた感動的な対応

    トレンド 

  • 5
    陣痛に苦しむ妊娠中の母親に、愛犬が見せた思いがけない反応

    トレンド 

話題

  • 1
    「最近、体力も筋力もガクッと落ちた」と思ったら…何歳から?“一気に老ける年齢”は本当にあった

    ライフスタイル 

  • 2
    「これを本当に飲んだのか…」1口5ドルでも即完売、米巨大アニメイベントで売られた“素足入りドリンク”に衛生問題が噴出

    トレンド 

  • 3
    「こんなタコは見たことがない」ガラパゴス深海1800mで発見…ゴルフボールサイズの“青い新種ミニタコ”

    トレンド 

  • 4
    「先に行くよ」の一言で彼女を山に置き去り…命の危険まで招く“登山破局男”の心理とは

    トレンド 

  • 5
    「頭頂部を高くすれば小顔で若く見える?」…頭皮を切開し穴まで開ける“頭の美容整形”に危険性の指摘も

    ヒント 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]