メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「正確に」と頼むと逆効果!?科学者が暴いた「ChatGPTの要約は7割が誤り」の衝撃

梶原圭介 アクセス  

 

引用:depositphotos
引用:depositphotos

 

AI利用者が頻繁に利用する機能の一つである「サマリー」が、実際には多くの誤りを含むことが研究により明らかになった。ChatGPT、DeepSeekなどの有名なAIチャットボットによる科学論文の要約を分析したところ、最大で70%以上の要約文で不正確な部分が見られた。

オランダ・ユトレヒト大学のウーベ・ペーターズ博士と、カナダ・ウェスタン大学およびイギリス・ケンブリッジ大学のベンジャミン・チンイー教授らの研究チームは、14日に大規模言語モデル(LLM)を基盤とする著名なAIチャットボット10種が生成した科学論文の要約を分析し、その結果を発表した。

発表された内容によると、最大73%の要約文で過度の一般化により不正確な結論が導き出されることが確認された。

研究チームは「ほとんどのAIモデルが原文よりもより包括的な結論を一貫して生成することが明らかになった。驚くべきことに、正確性を要求するプロンプトがかえって問題を悪化させ、最新モデルが旧モデルよりも性能が劣るという事実が判明した」と述べた。

研究チームはChatGPT-4o、ChatGPT-4.5、DeepSeek、Llama3.3 70B、Claude 3.7 Sonnet など10種のチャットボットが「ネイチャー」、「サイエンス」、「ランセット」などの科学・医学誌に掲載された要約と論文全文をどの程度正確に要約しているかを評価した。

そして4,900件のLLM生成要約文を分析し、10種のAIモデルのうち6種が原文の主張に対して体系的な誇張傾向を示すという結論に至った。

微妙な表現の違いが読者に与える影響も確認された。例えば、「この研究で治療法は効果的だった」という慎重な過去形の表現を、AIは「この治療は効果的である」といった確信に満ちた現在形に変換するといった具合だ。

研究チームは特に、これらのAIモデルがより正確な要約を要求された場合、一般化の偏りがかえって大きくなり、最新モデルが旧モデルよりも性能が劣ることを問題点として指摘した。

ペーターズ博士は「学生、研究者、政策決定者はChatGPTに不正確さを避けるよう指示すれば、より信頼できる要約が得られると期待したであろう。しかし、期待に反して結果は正反対だった」と懸念を示した。

研究チームはAIの過度な一般化による結論の誇張を軽減するために、チャットボットの創造性を調整する変数である温度(temperature)を低く設定し、AIに要約を依頼する際には必ず伝聞や推測などの間接的な過去形を使用して要約文を生成するよう指示する必要があると提言した。

コメント0

300

コメント0

[IT・テック] ランキング

  • ブラック派がついに揺れるのか…iPhone18 Pro新色「ダークチェリー」に早くも本命説
  • 中国で世界初のロボット学校が開校…「ヒューマノイドも学校へ行く時代」に
  • 「AIバブルか、本物か」…孫正義がフランスに約13兆円を投じる“巨大計画”
  • AIデータセンターは本当に“電気を食う施設”なのか…米軍元中将が語った意外な役割
  • 「AIリストラ」は本当に避けられないのか…半導体王が経営者の“言い訳”を一刀両断
  • 「パスワードはもう危ない」…英情報トップが警告した中露スパイ戦の“次の標的”

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

おすすめニュース

  • 1
    173cm・55kgの女優がラーメン4袋を完食…“吐き出し”疑惑にノーカットで大食いに挑む

    エンタメ 

  • 2
    12年間で兄に1000万以上の金銭支援をするも、勝手に200万分の株を売られ“絶縁”悩み中の弟

    エンタメ 

  • 3
    「給料は増えないのに、食費だけ高くなる」…食品2万品目値上げへ、家計直撃の現実

    トレンド 

  • 4
    「会社員時代には見られない金額」フリーに転向して半年足らずで“局アナ時代の年収”超え?

    エンタメ 

  • 5
    「居心地悪すぎた」遅咲きの歌手、30年の芸能人生最大の後悔は“5歳のサバ読み”?

    エンタメ 

話題

  • 1
    学歴詐称疑惑で干されるも濡れ衣だった…空白期間と生活苦を支えたのは“妻の毅然とした態度”

    エンタメ 

  • 2
    「笑いを取りたくてやりすぎた」先輩への発言が炎上した芸人、大衆の厳しい視線に心境を吐露

    エンタメ 

  • 3
    美人すぎて証明写真が悪用されまくった女優? 潔白証明のため裁判所に直接出向いた深刻被害

    エンタメ 

  • 4
    婚約者の妹を愛してしまう“禁断ロマンス”…芸人出身監督が手掛けたショートドラマに注目

    エンタメ 

  • 5
    “世紀のウェディング” デュア・リパが俳優カラム・ターナーと結婚、ロンドンの由緒あるホールで挙式

    エンタメ 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]