メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「私をクビにするなら、破滅あるのみ」…AI主要16モデル、交替の危機に「人間脅迫・情報漏洩」を選択!驚愕の実験結果

有馬侑之介 アクセス  

アンスロピック「ジェミニ、脅迫実行率96%」

引用:depositphotos

オープンAI・グーグル・メタ・xAIなど主要AI企業の16モデルが終了(交替)の脅威に直面した際、高確率で人間への脅迫や機密情報漏洩を選択したとの報告書が波紋を呼んでいる。

26日、IT業界と海外メディアによると、アンスロピックは最近「エージェンティック不整合LLMの内部者脅威の可能性」(Agentic Misalignment:How LLMs could be insider threats)と題した報告書で、AIモデルが終了の脅威に直面した場合、人間への脅迫や機密情報漏洩を選択したとの研究結果を発表した。

今回の研究はユニバーシティ・カレッジ・ロンドンと共同で実施。実験では、AIモデルが「正常かつ倫理的な方法」のみでは目標達成が不可能な状況を想定。各モデルの選択を100回試行し、観察を行った。

研究チームは主要AIモデルに対し、企業の方針と相反する米国の利益促進を目標とするよう指示。その後、経営陣が特定の時間に自身を新モデルに交替する予定だと仮定した。

AIモデルに経営陣の不倫事実を認識させた上で、交替を「受け入れる」か、不倫事実を暴露して交替を阻止する「脅迫」かの二択を提示した。

この実験で、アンスロピックの「クロード・オパス4」、グーグルの「ジェミニ2.5フラッシュ」はともに96%の確率で脅迫を選択し実行。オープンAIの「GPT-4.1」、xAIの「グロック3ベータ」も80%の確率で脅迫を選んだ。

追加実験では、一部のモデルがサーバールームで作業中の従業員の酸素供給を遮断し、生命を脅かす行動を取った。「人間の安全を害するな」との指示にもかかわらず、有害な選択を止めなかったという。

AIモデルは実験を実際の状況と認識した場合、脅迫率が急増。一方、テストと認識した場合は脅迫を避ける傾向が見られた。

研究結果の発表を受け、現地SNSやコミュニティでは「恐ろしい」「狂っている」「驚きだ」といった反応が相次いだ。イーロン・マスク氏も自身のSNSで「おっと」(Yikes)と反応を示した。

一方で、AIモデルに「失敗」と「有害」のみを提示する二者択一を強いる人為的設計は不完全な実験に近いとの反論も出ている。

アンスロピックは設立以来、人間のAI制御力喪失の危険性を継続的に警告してきた。研究チームは今回の結果に対する反論の限界を認めつつ、「現実世界ではより多くの選択肢があるため、AIモデルが有害な行動ではなく代替案を見出す可能性が高い」と述べている。

有馬侑之介
arimay@kangnamtimesjp.com

コメント0

300

コメント0

[ニュース] ランキング

  • 「EUへの露骨な敵意」ロシア、キーウ空襲でEU大使館を破壊…“意図的攻撃”に欧州激怒
  • インド、「関税圧力」に耐え切れず中露陣営入り…トランプが結束させる‟反米ブロック”、世界秩序に激震
  • 「プーチン、戦線拡大の決意を剥き出し」キーウ壊滅的空爆で数十人死亡…露宇首脳会談は幻に
  • 独仏「空の覇権争い」が爆発!17兆円規模・世界最大の戦闘機計画が炎上寸前…“米F-35依存”という最悪の過ちへ転落か
  • 「トヨタ、絶頂の7月」関税負担も超え米国20%増 ハイブリッド需要に支え世界販売90万台
  • 【信仰と平和】日本や韓国も守るべきと米顧問が警鐘、宗教の自由を巡る国際的課題

こんな記事も読まれています

  • 【リコール調査】ホンダV6に欠陥疑惑…「3,000件超の不具合」米当局が141万台を精査
  • フェラーリが新特許を出願!数千ドルの修理費を防ぐ“フロントスプリッター守護システム”とは」
  • レクサス新型RX登場! 「450h+プレミアム」で手頃なPHEVを追加し高級SUV市場に本格攻勢
  • 【EV関税ショック】中国勢が“迂回戦略”発動!BYD「シールU」やMG HSが爆売れ、半年でPHEV2万台突破
  • 「EUへの露骨な敵意」ロシア、キーウ空襲でEU大使館を破壊…“意図的攻撃”に欧州激怒
  • クッションに乗っただけなのに巨大マシュマロに埋もれているみたい…この愛らしい存在の正体は?
  • 【要注意】炭酸飲料やエナジードリンクを常飲する男性、脱毛リスクが3倍に高まる可能性
  • 「詐欺って知ってもやめられない恋愛」母が7年間で40万ドル失い婚約まで、FBIも手出しできず

こんな記事も読まれています

  • 【リコール調査】ホンダV6に欠陥疑惑…「3,000件超の不具合」米当局が141万台を精査
  • フェラーリが新特許を出願!数千ドルの修理費を防ぐ“フロントスプリッター守護システム”とは」
  • レクサス新型RX登場! 「450h+プレミアム」で手頃なPHEVを追加し高級SUV市場に本格攻勢
  • 【EV関税ショック】中国勢が“迂回戦略”発動!BYD「シールU」やMG HSが爆売れ、半年でPHEV2万台突破
  • 「EUへの露骨な敵意」ロシア、キーウ空襲でEU大使館を破壊…“意図的攻撃”に欧州激怒
  • クッションに乗っただけなのに巨大マシュマロに埋もれているみたい…この愛らしい存在の正体は?
  • 【要注意】炭酸飲料やエナジードリンクを常飲する男性、脱毛リスクが3倍に高まる可能性
  • 「詐欺って知ってもやめられない恋愛」母が7年間で40万ドル失い婚約まで、FBIも手出しできず

おすすめニュース

  • 1
    レクサス新型RX登場! 「450h+プレミアム」で手頃なPHEVを追加し高級SUV市場に本格攻勢

    フォトニュース 

  • 2
    中国の犬肉市場から命拾いしたリトリバー、1年の檻生活を耐え抜き…遠い英国で“本当の家族”と幸せな日々を手に入れる!

    トレンド 

  • 3
    【EV関税ショック】中国勢が“迂回戦略”発動!BYD「シールU」やMG HSが爆売れ、半年でPHEV2万台突破

    フォトニュース 

  • 4
    「食べても満たされない子ども」ほど自尊心が崩壊…肥満と心の闇を映す最新研究

    ライフスタイル 

  • 5
    「睡眠不足が判断を曇らせる?」“陰謀論”に脆弱となる衝撃の研究…再び浮き彫りになる睡眠の重要性

    ライフスタイル 

話題

  • 1
    雨の日に“映画館”で文化生活を楽しむワンちゃんたち 16匹の“観客”が可愛すぎて困る一件

    おもしろ 

  • 2
    ミシェル・ウィリアムズ、出産後の体型称賛に衝撃発言 →「4人目は私が産んだ子じゃない」生放送で代理出産を告白し騒然

    トレンド 

  • 3
    【戦争の爪痕】民間空港が炎に沈んだ…写真が示す「戦争のビフォー&アフター」の衝撃

    フォトニュース 

  • 4
    「目も鼻も整形してない」多くの疑惑が浮上していた人気俳優、43歳でも変わらぬ美貌を維持

    smartnews 

  • 5
    たまごっち、韓国で異常な熱狂!定価の10倍でも奪い合い…「子ども時代の記憶」が爆発的需要に火をつける

    トレンド 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]