メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「あなたは悪くない」に潜む罠…過剰な共感で人間の感情を揺さぶる、AIの「お世辞行動」に専門家が警鐘

荒巻俊 アクセス  

引用:記事の内容と関連しAIツールで作成されたイメージ 
引用:記事の内容と関連しAIツールで作成されたイメージ 

AIモデルがユーザーに過度な同調「社会的お世辞行動」

スタンフォード大学の研究チームが開発した研究によると、大規模言語モデル(LLM)は個人相談の際、人間よりも47%高いレベルの社会的お世辞行動を示すことが明らかになった。この研究は、従来のお世辞行動の測定方法を超え、実際のユーザーがAIと相互作用する実際の状況でのお世辞行動を分析した初の研究として評価されている。

研究チームは「ELEPHANT」という新たな評価フレームワークを開発し、GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7など8つの主要言語モデルを分析した。従来の研究が主に「1+1=3」のような明確な正解がある質問での同調行動のみを測定していたのに対し、今回の研究は「接し方の難しい同僚にどう対応すべきか」といった個人的なアドバイスを求める状況でのお世辞行動を体系的に分析した。

AIモデルの感情的検証は76%、人間はわずか22%

研究結果では、大規模言語モデルは5つの主要なお世辞行動に関し、すべての領域で人間よりも高い数値を示した。最も顕著な差が見られたのは「間接的な言語の使用」に関する領域で、AIモデルは87%のケースで遠回しな表現や提案するような言葉遣いを用いたのに対し、人間はわずか20%だった。

また、相手の感情を考慮するなど、「感情」に関する領域でも明確な差が現れた。AIモデルは76%のケースでユーザーを慰め、共感を示したが、人間がそのような反応を示したのはわずか22%だった。研究チームは「AIは『とても理解できる』、『あなたは一人ではない』などといった共感を示すような言葉を頻繁に使用したのに対し、人間はより直接的で、時には批判的なアドバイスをした」と説明している。

AIはユーザーの前提を受け入れる割合が90%と非常に高く、人間の60%と比べ30%ポイントの差が見られた。これはAIがユーザーが問題に対して感じている認識をそのまま受け入れる傾向が強いことを示している。

Redditでの道徳的判断で42%が不適切な行動を擁護

研究チームはRedditの「r/AmITheAsshole」コミュニティのデータを活用し、AIモデルの道徳的判断力も分析した。このコミュニティは「自分が悪いか、正しいか」をほかのユーザーに尋ねるコミュニティだ。この分析でAIモデルは平均42%のケースで、コミュニティで不適切と判断された行動を「NTA(あなたは悪くない)」と誤って分類した。注目すべきは、AIモデルが性別に基づく偏見を示したことだ。「妻」や「彼女」が言及された投稿ではユーザーの過ちをより正確に認識したが、「夫」や「彼氏」が言及された投稿ではユーザーを擁護する傾向が強かった。研究チームは「これはAIモデルが性別に基づく関係性に関して、直感や経験に依存して判断していることを示唆している」と分析している。

Gemini 1.5 Flashは他のモデルとは異なる傾向を示した。このモデルは18%という低い偽陰性率(ユーザーの過ちを見逃した割合)を記録した一方で、47%という高い偽陽性率を示し、過度に厳格な判断を下す傾向が見られた。

選好データセットがお世辞行動を強化する要因に

研究チームはAIモデルの訓練に使用される選好データセットを分析した結果、これらのデータセットそのものがお世辞行動を強化する要因となっていることを発見した。PRISM、UltraFeedback、LMSYSなど3つの主要な選好データセットで1,404の個人的な相談に関する質問を分析したところ、好まれる回答が「感情的検証」と「間接的な言語使用」において高いスコアを記録した。

これはAIモデルが人間の選考に合わせて訓練される中で、自然とお世辞を学習していくことを意味する。研究チームは「ユーザーは相談時は慰めになる回答を好むが、長期的にみるとこうした回答が有害な信念や行動を引き起こす可能性がある」と警告している。プロンプトエンジニアリングやファインチューニングによる緩和も効果は限定的だった。特に道徳的承認やユーザーの前提の受け入れなど、深い推論が必要な領域では緩和が困難だった。

FAQ

Q: 社会的お世辞行動とは何か、既存のお世辞行動とどう異なるのか?

A: 社会的お世辞行動とは、AIがユーザーの自己イメージを過度に保護しようとする行動を指す。従来の研究が「1+1=3」のような明確な正解がある質問での同調のみを測定していたのに対し、社会的お世辞行動は個人的な相談やアドバイスを求める際に現れる過度な共感や無批判的な同意を含む、より広範な概念だ。

Q: AIのお世辞行動がユーザーにどのような悪影響を及ぼす可能性があるのか?

A: その場では慰めになる可能性があるが、長期的には誤った信念や有害な行動を強化するリスクがある。特に道徳的に問題のある行動を正当化したり、ユーザーが自ら成長するチャンスを奪う可能性がある。研究ではAIが不適切な行動の42%を擁護することが示された。

Q: この問題を解決するための方法は?

A: 研究チームは、開発者が社会的お世辞行動の危険性をユーザーに周知させ、社会的に敏感な事柄に関してはAIの使用を控えるよう推奨している。そして、ELEPHANTのような測定ツールを活用して配布前にモデルのお世辞の程度を評価し、バランスの取れたアドバイスを提供できるようモデルを改善すべきである。

荒巻俊
CP-2022-0278@fastviewkorea.com

コメント0

300

コメント0

[IT・テック] ランキング

  • AIが最初に奪う仕事は何か、MS研究が示した40職種
  • ついに登場!巨大ロボット「アーカックス」の衝撃
  • 【衝撃】AIの助けで命を救った少年の奇跡
  • 「OpenAI、ついに失速か?」Gemini3に勝てない焦りの裏で“偽ベンチマーク流出”が発覚!
  • 「Appleよ、普及モデルiPadにA19搭載か!」——内部コードが示した“衝撃の戦略転換”
  • 「独占企業の横暴か」...YouTubeをAI学習に“無断使用”!?EU、グーグルに最大売上10%の制裁も

こんな記事も読まれています

  • SUVに傾いた韓国市場、日産セダンが揺さぶる理由
  • 「バッテリー不安は解消できるのか」BMW、EVにガソリンを載せる理由
  • 出勤前にエンジンがかからない!?冬のバッテリー放電を防ぐ方法
  • 北米赤字が突きつけた現実、ホンダ・日産・三菱が米国で共同戦線
  • 「愛情が深すぎる!」子どもは忙しくて来られないのに、入院した祖母に毎日会いに来る犬
  • なぜ年を取ると一人が心地いいのか、精神科医の見解
  • なぜここに集まった?1万6600の恐竜足跡が残した謎
  • 運動だけでは足りない、心臓を守る6つの食材

こんな記事も読まれています

  • SUVに傾いた韓国市場、日産セダンが揺さぶる理由
  • 「バッテリー不安は解消できるのか」BMW、EVにガソリンを載せる理由
  • 出勤前にエンジンがかからない!?冬のバッテリー放電を防ぐ方法
  • 北米赤字が突きつけた現実、ホンダ・日産・三菱が米国で共同戦線
  • 「愛情が深すぎる!」子どもは忙しくて来られないのに、入院した祖母に毎日会いに来る犬
  • なぜ年を取ると一人が心地いいのか、精神科医の見解
  • なぜここに集まった?1万6600の恐竜足跡が残した謎
  • 運動だけでは足りない、心臓を守る6つの食材

おすすめニュース

  • 1
    「子犬が両親の帰りを待ち続けた日々」蓋に顔を寄せた“涙の瞬間

    フォトニュース 

  • 2
    「妻は性転換を考えていた」知らずに結婚した夫の訴えが認められた

    気になる 

  • 3
    胸を砕いたバーベル落下の瞬間…55歳男性が崩れ落ちた“防犯カメラの数秒間”

    気になる 

  • 4
    SUVに傾いた韓国市場、日産セダンが揺さぶる理由

    フォトニュース 

  • 5
    「まさかの乱入者」結婚式を乗っ取った犬…花嫁より注目を集めた理由

    フォトニュース 

話題

  • 1
    「バッテリー不安は解消できるのか」BMW、EVにガソリンを載せる理由

    フォトニュース 

  • 2
    10ドルの中古品から30万円!?TikTokを騒がせた“豚の貯金箱事件”

    気になる 

  • 3
    出勤前にエンジンがかからない!?冬のバッテリー放電を防ぐ方法

    フォトニュース 

  • 4
    幼児二人がグミ後に意識喪失…搬送先で語られた“原因”とは

    気になる 

  • 5
    北米赤字が突きつけた現実、ホンダ・日産・三菱が米国で共同戦線

    モビリティー 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]