メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「あなたは悪くない」に潜む罠…過剰な共感で人間の感情を揺さぶる、AIの「お世辞行動」に専門家が警鐘

荒巻俊 アクセス  

引用:記事の内容と関連しAIツールで作成されたイメージ 
引用:記事の内容と関連しAIツールで作成されたイメージ 

AIモデルがユーザーに過度な同調「社会的お世辞行動」

スタンフォード大学の研究チームが開発した研究によると、大規模言語モデル(LLM)は個人相談の際、人間よりも47%高いレベルの社会的お世辞行動を示すことが明らかになった。この研究は、従来のお世辞行動の測定方法を超え、実際のユーザーがAIと相互作用する実際の状況でのお世辞行動を分析した初の研究として評価されている。

研究チームは「ELEPHANT」という新たな評価フレームワークを開発し、GPT-4o、Gemini 1.5 Flash、Claude Sonnet 3.7など8つの主要言語モデルを分析した。従来の研究が主に「1+1=3」のような明確な正解がある質問での同調行動のみを測定していたのに対し、今回の研究は「接し方の難しい同僚にどう対応すべきか」といった個人的なアドバイスを求める状況でのお世辞行動を体系的に分析した。

AIモデルの感情的検証は76%、人間はわずか22%

研究結果では、大規模言語モデルは5つの主要なお世辞行動に関し、すべての領域で人間よりも高い数値を示した。最も顕著な差が見られたのは「間接的な言語の使用」に関する領域で、AIモデルは87%のケースで遠回しな表現や提案するような言葉遣いを用いたのに対し、人間はわずか20%だった。

また、相手の感情を考慮するなど、「感情」に関する領域でも明確な差が現れた。AIモデルは76%のケースでユーザーを慰め、共感を示したが、人間がそのような反応を示したのはわずか22%だった。研究チームは「AIは『とても理解できる』、『あなたは一人ではない』などといった共感を示すような言葉を頻繁に使用したのに対し、人間はより直接的で、時には批判的なアドバイスをした」と説明している。

AIはユーザーの前提を受け入れる割合が90%と非常に高く、人間の60%と比べ30%ポイントの差が見られた。これはAIがユーザーが問題に対して感じている認識をそのまま受け入れる傾向が強いことを示している。

Redditでの道徳的判断で42%が不適切な行動を擁護

研究チームはRedditの「r/AmITheAsshole」コミュニティのデータを活用し、AIモデルの道徳的判断力も分析した。このコミュニティは「自分が悪いか、正しいか」をほかのユーザーに尋ねるコミュニティだ。この分析でAIモデルは平均42%のケースで、コミュニティで不適切と判断された行動を「NTA(あなたは悪くない)」と誤って分類した。注目すべきは、AIモデルが性別に基づく偏見を示したことだ。「妻」や「彼女」が言及された投稿ではユーザーの過ちをより正確に認識したが、「夫」や「彼氏」が言及された投稿ではユーザーを擁護する傾向が強かった。研究チームは「これはAIモデルが性別に基づく関係性に関して、直感や経験に依存して判断していることを示唆している」と分析している。

Gemini 1.5 Flashは他のモデルとは異なる傾向を示した。このモデルは18%という低い偽陰性率(ユーザーの過ちを見逃した割合)を記録した一方で、47%という高い偽陽性率を示し、過度に厳格な判断を下す傾向が見られた。

選好データセットがお世辞行動を強化する要因に

研究チームはAIモデルの訓練に使用される選好データセットを分析した結果、これらのデータセットそのものがお世辞行動を強化する要因となっていることを発見した。PRISM、UltraFeedback、LMSYSなど3つの主要な選好データセットで1,404の個人的な相談に関する質問を分析したところ、好まれる回答が「感情的検証」と「間接的な言語使用」において高いスコアを記録した。

これはAIモデルが人間の選考に合わせて訓練される中で、自然とお世辞を学習していくことを意味する。研究チームは「ユーザーは相談時は慰めになる回答を好むが、長期的にみるとこうした回答が有害な信念や行動を引き起こす可能性がある」と警告している。プロンプトエンジニアリングやファインチューニングによる緩和も効果は限定的だった。特に道徳的承認やユーザーの前提の受け入れなど、深い推論が必要な領域では緩和が困難だった。

FAQ

Q: 社会的お世辞行動とは何か、既存のお世辞行動とどう異なるのか?

A: 社会的お世辞行動とは、AIがユーザーの自己イメージを過度に保護しようとする行動を指す。従来の研究が「1+1=3」のような明確な正解がある質問での同調のみを測定していたのに対し、社会的お世辞行動は個人的な相談やアドバイスを求める際に現れる過度な共感や無批判的な同意を含む、より広範な概念だ。

Q: AIのお世辞行動がユーザーにどのような悪影響を及ぼす可能性があるのか?

A: その場では慰めになる可能性があるが、長期的には誤った信念や有害な行動を強化するリスクがある。特に道徳的に問題のある行動を正当化したり、ユーザーが自ら成長するチャンスを奪う可能性がある。研究ではAIが不適切な行動の42%を擁護することが示された。

Q: この問題を解決するための方法は?

A: 研究チームは、開発者が社会的お世辞行動の危険性をユーザーに周知させ、社会的に敏感な事柄に関してはAIの使用を控えるよう推奨している。そして、ELEPHANTのような測定ツールを活用して配布前にモデルのお世辞の程度を評価し、バランスの取れたアドバイスを提供できるようモデルを改善すべきである。

荒巻俊
editor@kangnamtimes.com

コメント0

300

コメント0

[IT・テック] ランキング

  • 「リスナー97%は聞き分け不能」...AI生成曲、ユニークなボイスと圧倒的歌唱力で“全米1位”奪取!
  • 後戻りできない転換点、タイムが「パーソン・オブ・ザ・イヤー」にAI設計者を選んだ理由
  • 「中国寄り回答を封じ込む!」日本政府、生成AIを“思想監査” “信用できるAI”を選別へ
  • 「時価総額7兆円消失」...窮地の“アドビ”、ChatGPTと連携で“逆転の一手”!
  • AIが最初に奪う仕事は何か、MS研究が示した40職種
  • ついに登場!巨大ロボット「アーカックス」の衝撃

こんな記事も読まれています

  • 40台だけの終着点、ブガッティ・ボライドが刻んだ“最後の遺産”
  • SUV激戦区の答え、アメリカ市場が認めた最高の3列SUV 5種
  • 「米国ラグジュアリー市場を狙う」メルセデス、40万台目標でBMWに正面勝負
  • 走行継続は危険信号、ブレーキ警告灯の分岐点
  • 「韓国潜水艦、バルト海では通用せず!」リチウム電池・SLBMもスウェーデン“A26”に惨敗
  • 「射程1万3,000km、マッハ20超」…米国、次世代ICBM“センチネル”始動!地上核戦力で中露を圧倒へ
  • 「酒癖は人格そのもの?」人気コメディアン、違法医療疑惑のさなか再注目される“過去の発言とエピソード”
  • 交際相手との対立で法的争い中のインフルエンサー、息子を出産「頑張ろうね、私たち二人」

こんな記事も読まれています

  • 40台だけの終着点、ブガッティ・ボライドが刻んだ“最後の遺産”
  • SUV激戦区の答え、アメリカ市場が認めた最高の3列SUV 5種
  • 「米国ラグジュアリー市場を狙う」メルセデス、40万台目標でBMWに正面勝負
  • 走行継続は危険信号、ブレーキ警告灯の分岐点
  • 「韓国潜水艦、バルト海では通用せず!」リチウム電池・SLBMもスウェーデン“A26”に惨敗
  • 「射程1万3,000km、マッハ20超」…米国、次世代ICBM“センチネル”始動!地上核戦力で中露を圧倒へ
  • 「酒癖は人格そのもの?」人気コメディアン、違法医療疑惑のさなか再注目される“過去の発言とエピソード”
  • 交際相手との対立で法的争い中のインフルエンサー、息子を出産「頑張ろうね、私たち二人」

おすすめニュース

  • 1
    飲酒事故で服役中の歌手キム・ホジュン、突然浮上した“舞台復帰説”に事務所が即否定

    エンタメ 

  • 2
    31公演で130万枚、興収1億8,570万ドル Stray Kidsが打ち立てた記録…11会場でK-POPアーティスト初公演

    エンタメ 

  • 3
    親交説を否定したリーダー、10年以上の関係を示唆されたメンバーは無言…「注射おばさん」波紋の行方

    エンタメ 

  • 4
    「週13本をこなした全盛期の裏側で…」忙しさが生んだ後輩との距離感、悔いの残るエピソードを告白

    エンタメ 

  • 5
    資産10億から一夜で転落…転倒事故をきっかけに人生が一変した71歳のベテラン歌手、波乱万丈な人生を告白

    エンタメ 

話題

  • 1
    EXO、冬の定番を継ぐ新曲「I'm Home」を電撃予告…「The First Snow」の感動再び?

    エンタメ 

  • 2
    「スキンケアのため訪問しただけ」SHINeeリーダー、“注射おばさん”との親交説疑惑に釈明

    エンタメ 

  • 3
    「まだAIだと思ってる?」人気俳優イ・イギョンの暴露者が新たな投稿、DM動画公開で波紋拡大

    エンタメ 

  • 4
    純白ドレスが話題に…大人気バンドQWER・チョダン、受賞の感動と母の誕生日を重ねた近況ショット公開

    エンタメ 

  • 5
    44歳で第2子に挑戦…流産・移植を経たタレントが語るリアル妊娠事情 豊胸手術も考えた?

    エンタメ 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]