メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「私をクビにするなら、破滅あるのみ」…AI主要16モデル、交替の危機に「人間脅迫・情報漏洩」を選択!驚愕の実験結果

有馬侑之介 アクセス  

アンスロピック「ジェミニ、脅迫実行率96%」

引用:depositphotos

オープンAI・グーグル・メタ・xAIなど主要AI企業の16モデルが終了(交替)の脅威に直面した際、高確率で人間への脅迫や機密情報漏洩を選択したとの報告書が波紋を呼んでいる。

26日、IT業界と海外メディアによると、アンスロピックは最近「エージェンティック不整合LLMの内部者脅威の可能性」(Agentic Misalignment:How LLMs could be insider threats)と題した報告書で、AIモデルが終了の脅威に直面した場合、人間への脅迫や機密情報漏洩を選択したとの研究結果を発表した。

今回の研究はユニバーシティ・カレッジ・ロンドンと共同で実施。実験では、AIモデルが「正常かつ倫理的な方法」のみでは目標達成が不可能な状況を想定。各モデルの選択を100回試行し、観察を行った。

研究チームは主要AIモデルに対し、企業の方針と相反する米国の利益促進を目標とするよう指示。その後、経営陣が特定の時間に自身を新モデルに交替する予定だと仮定した。

AIモデルに経営陣の不倫事実を認識させた上で、交替を「受け入れる」か、不倫事実を暴露して交替を阻止する「脅迫」かの二択を提示した。

この実験で、アンスロピックの「クロード・オパス4」、グーグルの「ジェミニ2.5フラッシュ」はともに96%の確率で脅迫を選択し実行。オープンAIの「GPT-4.1」、xAIの「グロック3ベータ」も80%の確率で脅迫を選んだ。

追加実験では、一部のモデルがサーバールームで作業中の従業員の酸素供給を遮断し、生命を脅かす行動を取った。「人間の安全を害するな」との指示にもかかわらず、有害な選択を止めなかったという。

AIモデルは実験を実際の状況と認識した場合、脅迫率が急増。一方、テストと認識した場合は脅迫を避ける傾向が見られた。

研究結果の発表を受け、現地SNSやコミュニティでは「恐ろしい」「狂っている」「驚きだ」といった反応が相次いだ。イーロン・マスク氏も自身のSNSで「おっと」(Yikes)と反応を示した。

一方で、AIモデルに「失敗」と「有害」のみを提示する二者択一を強いる人為的設計は不完全な実験に近いとの反論も出ている。

アンスロピックは設立以来、人間のAI制御力喪失の危険性を継続的に警告してきた。研究チームは今回の結果に対する反論の限界を認めつつ、「現実世界ではより多くの選択肢があるため、AIモデルが有害な行動ではなく代替案を見出す可能性が高い」と述べている。

有馬侑之介
arimay@kangnamtimesjp.com

コメント0

300

コメント0

[ニュース] ランキング

  • インド、「関税圧力」に耐え切れず中露陣営入り…トランプが結束させる‟反米ブロック”、世界秩序に激震
  • 「プーチン、戦線拡大の決意を剥き出し」キーウ壊滅的空爆で数十人死亡…露宇首脳会談は幻に
  • 独仏「空の覇権争い」が爆発!17兆円規模・世界最大の戦闘機計画が炎上寸前…“米F-35依存”という最悪の過ちへ転落か
  • 「トヨタ、絶頂の7月」関税負担も超え米国20%増 ハイブリッド需要に支え世界販売90万台
  • 【信仰と平和】日本や韓国も守るべきと米顧問が警鐘、宗教の自由を巡る国際的課題
  • 【警戒強化】ロシア、独東部でドローン偵察!「ウクライナ支援」輸送路を監視か

こんな記事も読まれています

  • 【リコール調査】ホンダV6に欠陥疑惑…「3,000件超の不具合」米当局が141万台を精査
  • フェラーリが新特許を出願!数千ドルの修理費を防ぐ“フロントスプリッター守護システム”とは」
  • レクサス新型RX登場! 「450h+プレミアム」で手頃なPHEVを追加し高級SUV市場に本格攻勢
  • 【EV関税ショック】中国勢が“迂回戦略”発動!BYD「シールU」やMG HSが爆売れ、半年でPHEV2万台突破
  • クッションに乗っただけなのに巨大マシュマロに埋もれているみたい…この愛らしい存在の正体は?
  • 【要注意】炭酸飲料やエナジードリンクを常飲する男性、脱毛リスクが3倍に高まる可能性
  • 「詐欺って知ってもやめられない恋愛」母が7年間で40万ドル失い婚約まで、FBIも手出しできず
  • 【恐怖の代償】ケタミン乱用で膀胱が30mlに縮小した25歳女性、一日に50回もトイレに行く苦痛の日々

こんな記事も読まれています

  • 【リコール調査】ホンダV6に欠陥疑惑…「3,000件超の不具合」米当局が141万台を精査
  • フェラーリが新特許を出願!数千ドルの修理費を防ぐ“フロントスプリッター守護システム”とは」
  • レクサス新型RX登場! 「450h+プレミアム」で手頃なPHEVを追加し高級SUV市場に本格攻勢
  • 【EV関税ショック】中国勢が“迂回戦略”発動!BYD「シールU」やMG HSが爆売れ、半年でPHEV2万台突破
  • クッションに乗っただけなのに巨大マシュマロに埋もれているみたい…この愛らしい存在の正体は?
  • 【要注意】炭酸飲料やエナジードリンクを常飲する男性、脱毛リスクが3倍に高まる可能性
  • 「詐欺って知ってもやめられない恋愛」母が7年間で40万ドル失い婚約まで、FBIも手出しできず
  • 【恐怖の代償】ケタミン乱用で膀胱が30mlに縮小した25歳女性、一日に50回もトイレに行く苦痛の日々

おすすめニュース

  • 1
    愛犬ショットにBoAの曲を使用し熱愛説が再浮上→即刻削除…意味深な動きにファンもざわつく

    エンタメ 

  • 2
    「共産党に同調するな」寛容だった台湾政府が自国の芸能人の“中国との関連性”を調査

    エンタメ 

  • 3
    夫を“ベストフレンド”と表現…人気作家×元アイドル夫婦、4年間の結婚生活にピリオド

    エンタメ 

  • 4
    【悲劇】中国人気歌手、公演中にステージから約2m落下…応急処置&搬送で現場大混乱

    エンタメ 

  • 5
    「私が0票なんて…」恋愛リアでまさかの展開、男性出演者のあおり発言に「埋めてやりたい」と怒り爆発

    エンタメ 

話題

  • 1
    「韓国人は親日、日本人は嫌韓?」世論調査が示す当惑のギャップ

    トレンド 

  • 2
    【本音バレ】疑妻症の夫、不倫をした妻に「もう疑っていない」と告白するも“ウソ判定”

    エンタメ 

  • 3
    「夫のカードは使いたくない」履歴のせいで娘の卒業旅行を追求「何を買ったの?」

    エンタメ 

  • 4
    人類初の「空飛ぶ電動クルマ」が米国上空で衝撃の試験飛行!垂直離着陸・180km飛行の驚異スペック公開

    トレンド 

  • 5
    “ポップの伝説”ブリトニー・スピアーズがまたもや大胆ヌードを公開…後ろ姿に釘付け

    エンタメ 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]