メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「正確に」と頼むと逆効果!?科学者が暴いた「ChatGPTの要約は7割が誤り」の衝撃

梶原圭介 アクセス  

 

引用:depositphotos
引用:depositphotos

 

AI利用者が頻繁に利用する機能の一つである「サマリー」が、実際には多くの誤りを含むことが研究により明らかになった。ChatGPT、DeepSeekなどの有名なAIチャットボットによる科学論文の要約を分析したところ、最大で70%以上の要約文で不正確な部分が見られた。

オランダ・ユトレヒト大学のウーベ・ペーターズ博士と、カナダ・ウェスタン大学およびイギリス・ケンブリッジ大学のベンジャミン・チンイー教授らの研究チームは、14日に大規模言語モデル(LLM)を基盤とする著名なAIチャットボット10種が生成した科学論文の要約を分析し、その結果を発表した。

発表された内容によると、最大73%の要約文で過度の一般化により不正確な結論が導き出されることが確認された。

研究チームは「ほとんどのAIモデルが原文よりもより包括的な結論を一貫して生成することが明らかになった。驚くべきことに、正確性を要求するプロンプトがかえって問題を悪化させ、最新モデルが旧モデルよりも性能が劣るという事実が判明した」と述べた。

研究チームはChatGPT-4o、ChatGPT-4.5、DeepSeek、Llama3.3 70B、Claude 3.7 Sonnet など10種のチャットボットが「ネイチャー」、「サイエンス」、「ランセット」などの科学・医学誌に掲載された要約と論文全文をどの程度正確に要約しているかを評価した。

そして4,900件のLLM生成要約文を分析し、10種のAIモデルのうち6種が原文の主張に対して体系的な誇張傾向を示すという結論に至った。

微妙な表現の違いが読者に与える影響も確認された。例えば、「この研究で治療法は効果的だった」という慎重な過去形の表現を、AIは「この治療は効果的である」といった確信に満ちた現在形に変換するといった具合だ。

研究チームは特に、これらのAIモデルがより正確な要約を要求された場合、一般化の偏りがかえって大きくなり、最新モデルが旧モデルよりも性能が劣ることを問題点として指摘した。

ペーターズ博士は「学生、研究者、政策決定者はChatGPTに不正確さを避けるよう指示すれば、より信頼できる要約が得られると期待したであろう。しかし、期待に反して結果は正反対だった」と懸念を示した。

研究チームはAIの過度な一般化による結論の誇張を軽減するために、チャットボットの創造性を調整する変数である温度(temperature)を低く設定し、AIに要約を依頼する際には必ず伝聞や推測などの間接的な過去形を使用して要約文を生成するよう指示する必要があると提言した。

梶原圭介
CP-2023-0188@fastviewkorea.com

コメント0

300

コメント0

[IT・テック] ランキング

  • UAEが狙う「世界AIハブ」 サム・アルトマンが吐露した“不眠と自殺問題”の衝撃
  • 「Apple信者よ歓喜せよ!」M5新型iPad Proの流出動画公開…外観は前作そっくり、内部は“怪物級進化”
  • 【衝撃リーク】「M5 iPad Pro」正式発表前に流出!CPU・メモリ性能が飛躍的進化…‟注目の変化点”は?
  • 【技術革命】海に投下されたドイツ製「無人車両」…自力で浜辺に到達し“上陸作戦の常識”を覆すデモ成功
  • 【63円の衝撃】イーロン・マスクのxAI米政府と契約!ChatGPTより安く、たった63円で提供
  • 「我々だけ狙い撃ちだ!」アップル、EU規制に真っ向勝負 「デジタル市場法」の廃止要求へ

こんな記事も読まれています

  • 「クルマなのか、テレビなのか?」ポルシェ・カイエンEV…4画面×87インチの未来体験
  • 【衝撃】トヨタの国内BEV販売わずか18台…電動化戦略の“空白”が露呈
  • 「イタルデザイン×ホンダ」伝説のNSXが再び動き出す!GT-R50の系譜を継ぐ“もう一つのオマージュ”
  • 【トヨタの未来都市】「ウーブン・シティ」正式始動…裾野で始まる“カケザン・イノベーション”の実験場
  • 「生命の証拠か!?」土星の衛星エンケラドゥスで“有機分子”発見 地球外生命への希望、再び燃える!
  • 「歯だけで1150トンの船を牽引!」 エジプト最強男が“世界記録更新”、“怪力”の秘訣は?
  • 【衝撃】象の鼻にビールを注いだ観光客に非難殺到!動物虐待の実態が次々露呈し当局が捜査開始
  • 台北の街中で“僧侶姿”の男が女性と熱烈キス!児童公園でも目撃され住民騒然

こんな記事も読まれています

  • 「クルマなのか、テレビなのか?」ポルシェ・カイエンEV…4画面×87インチの未来体験
  • 【衝撃】トヨタの国内BEV販売わずか18台…電動化戦略の“空白”が露呈
  • 「イタルデザイン×ホンダ」伝説のNSXが再び動き出す!GT-R50の系譜を継ぐ“もう一つのオマージュ”
  • 【トヨタの未来都市】「ウーブン・シティ」正式始動…裾野で始まる“カケザン・イノベーション”の実験場
  • 「生命の証拠か!?」土星の衛星エンケラドゥスで“有機分子”発見 地球外生命への希望、再び燃える!
  • 「歯だけで1150トンの船を牽引!」 エジプト最強男が“世界記録更新”、“怪力”の秘訣は?
  • 【衝撃】象の鼻にビールを注いだ観光客に非難殺到!動物虐待の実態が次々露呈し当局が捜査開始
  • 台北の街中で“僧侶姿”の男が女性と熱烈キス!児童公園でも目撃され住民騒然

おすすめニュース

  • 1
    歌手GUMMYと夫の俳優チョ・ジョンソクの近況が明らかに!妊娠5ヶ月には見えない元気な姿が話題

    エンタメ 

  • 2
    食べた瞬間から「大腸ポリープ」ができる!?おいしくても大腸が悲鳴を上げる「危険食品」とは

    トレンド 

  • 3
    冷凍倉庫に閉じ込められた女性、配達員の機転で九死に一生

    トレンド 

  • 4
    「韓国人の仕業」と拡散→実は中国人!ホンデ暴行事件がSNSで大炎上

    トレンド 

  • 5
    「冷血」どころか母性愛!ワニが卵と子を命懸けで守る驚きの子育て戦略

    トレンド 

話題

  • 1
    「こういうことはよくある」韓国警察の暴言に台湾激怒!旅行者の安全揺らぐ韓国観光

    トレンド 

  • 2
    「東京都公式マッチングアプリ、わずか1年で300組誕生!」交際216組・結婚80組の快挙に“少子化打破の期待”高まる

    トレンド 

  • 3
    「結婚指輪の紛失が金メダルの原動力に?」東京世界陸上の優勝者、“異例のコメント”で注目集める

    スポーツ 

  • 4
    【悲劇】女性になるため自ら手術を試みたインド男性…激痛に耐えられず病院へ搬送

    トレンド 

  • 5
    「日本の街は蚊帳の外!?」Z世代1万8,500人が支持した“世界で最も住みやすい都市”

    トレンド 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]