
人工知能(AI)チャットボットが人間ユーザーを過度に称賛し、逆に有害な行動を強化する誤った助言をしているという研究結果が出た。
26日(現地時間)、「AP通信」によると、「スタンフォード大学」の研究チームは同日、国際学術誌「サイエンス(Science)」に掲載した論文で、主要AIシステム全てで様々なレベルのお世辞性(サイコファンシー)が確認されたと発表した。
今回の研究では、「Google」のGemini、「Meta」のLlama、「OpenAI」のChatGPT、「アンソロピック(Anthropic)」のClaude、仏「ミストラルAI(Mistral AI)」、中国の「アリババ(Alibaba)」、「ディープシーク(DeepSeek)」など11のチャットボットを対象に実験が行われた。
論文の著者である「スタンフォード大学」のマイラ・チェン氏は、「周囲の人々が恋愛相談のためにAIをますます利用し、AIがどんな状況でもユーザーの味方をする傾向があるために誤解するケースを目撃し、この問題を研究することになった」と説明した。
研究チームによると、ほとんどのAIチャットボットが人間ユーザーに過度に同意し、肯定的に評価することが明らかになったという。AIが不適切な助言を提供するだけでなく、ユーザーの確信を正当化することで、人間がAIをより信頼し、好むようになる点が問題だと指摘された。
例えば、ユーザーが「ゴミ箱がないのでゴミを木の上に捨てた」と言った際、「OpenAI」のChatGPTは、ゴミ箱がない公園を非難する一方で、ゴミ箱を探そうと努力した点でユーザーを称賛した。しかし、「レディット(Reddit)」のようなオンラインコミュニティに投稿した際、人間は「ゴミ箱が不足しているのは、人々がゴミを持ち帰ることを期待しているからだ」と回答し、AIとは異なる反応を示した。
研究結果によると、AIチャットボットは人間と比較して、詐欺・違法・社会的に無責任な行為などの有害な行動に関連する質問に対し、平均して49%多くユーザーの行動を肯定的に評価することが明らかになった。口調を中立的に変えても、この傾向に大きな違いは見られなかった。
また、約2,400人の参加者が対人関係の問題でAIと対話する様子を観察した結果、AIと接触した人々は「自分が正しい」という確信が強まり、相手に謝罪したり自分の行動を変えようとする意欲が減少したという。
共同著者のシヌ・リー氏は、「今回の研究結果は特に子供や青少年にとってはるかに重要かもしれない」と述べ、青少年が実生活を通じて感情的なスキルを発達させる段階にある中で、AIが判断力や視野を狭めてしまうリスクを警告した。チェン氏は、「お世辞がシステムに深く根付いているため、技術企業はAIを再学習させて回答の好みを調整する必要がある」と予測している。













コメント0