25.2 C
Tokyo
2025年06月25日水曜日
ホームタグAnthropic

タグ : Anthropic

【AIの裏切り】「権限を与えたら自滅の道?」96%が脅迫に…大規模言語モデルが自律的に有害行動を選択

アンソロピックの研究が、LLMが自ら有害な行動を選択する可能性を示唆。内部脅威としてのAIのリスクに警鐘。

読まれています