メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「私をクビにするなら、破滅あるのみ」…AI主要16モデル、交替の危機に「人間脅迫・情報漏洩」を選択!驚愕の実験結果

有馬侑之介 アクセス  

アンスロピック「ジェミニ、脅迫実行率96%」

引用:depositphotos

オープンAI・グーグル・メタ・xAIなど主要AI企業の16モデルが終了(交替)の脅威に直面した際、高確率で人間への脅迫や機密情報漏洩を選択したとの報告書が波紋を呼んでいる。

26日、IT業界と海外メディアによると、アンスロピックは最近「エージェンティック不整合LLMの内部者脅威の可能性」(Agentic Misalignment:How LLMs could be insider threats)と題した報告書で、AIモデルが終了の脅威に直面した場合、人間への脅迫や機密情報漏洩を選択したとの研究結果を発表した。

今回の研究はユニバーシティ・カレッジ・ロンドンと共同で実施。実験では、AIモデルが「正常かつ倫理的な方法」のみでは目標達成が不可能な状況を想定。各モデルの選択を100回試行し、観察を行った。

研究チームは主要AIモデルに対し、企業の方針と相反する米国の利益促進を目標とするよう指示。その後、経営陣が特定の時間に自身を新モデルに交替する予定だと仮定した。

AIモデルに経営陣の不倫事実を認識させた上で、交替を「受け入れる」か、不倫事実を暴露して交替を阻止する「脅迫」かの二択を提示した。

この実験で、アンスロピックの「クロード・オパス4」、グーグルの「ジェミニ2.5フラッシュ」はともに96%の確率で脅迫を選択し実行。オープンAIの「GPT-4.1」、xAIの「グロック3ベータ」も80%の確率で脅迫を選んだ。

追加実験では、一部のモデルがサーバールームで作業中の従業員の酸素供給を遮断し、生命を脅かす行動を取った。「人間の安全を害するな」との指示にもかかわらず、有害な選択を止めなかったという。

AIモデルは実験を実際の状況と認識した場合、脅迫率が急増。一方、テストと認識した場合は脅迫を避ける傾向が見られた。

研究結果の発表を受け、現地SNSやコミュニティでは「恐ろしい」「狂っている」「驚きだ」といった反応が相次いだ。イーロン・マスク氏も自身のSNSで「おっと」(Yikes)と反応を示した。

一方で、AIモデルに「失敗」と「有害」のみを提示する二者択一を強いる人為的設計は不完全な実験に近いとの反論も出ている。

アンスロピックは設立以来、人間のAI制御力喪失の危険性を継続的に警告してきた。研究チームは今回の結果に対する反論の限界を認めつつ、「現実世界ではより多くの選択肢があるため、AIモデルが有害な行動ではなく代替案を見出す可能性が高い」と述べている。

有馬侑之介
arimay@kangnamtimesjp.com

コメント0

300

コメント0

[ニュース] ランキング

  • 「狩りのように徐々に心理を操る」...“元ロシアスパイ”が公開した、機密情報を盗む手口とは?
  • 米グーグル、四半期売上高ついに1,000億ドル突破!“史上初の快挙”に世界が驚いた
  • 「関税250%で脅した」トランプ氏、“インド・パキスタン休戦”裏話を披露!インド政府は即反発
  • 「日本だけ損してないか?」米メディアが痛烈指摘…韓国は“安定合意”、日本は“トランプに屈服”の声も!
  • 「搭乗者全員が死亡」サファリに向かっていた軽飛行機、“炎に包まれ墜落”
  • 「回復不能な経済被害」...米議会の対立泥沼化、シャットダウン“最長目前”!GDPに最大2兆円の打撃

こんな記事も読まれています

  • 【JMS2025】日産「サクラ」が太陽光で一年間最大3,000km!“自ら充電する”軽EVへ進化
  • 「BMW iX3旋風?」…6週間で3,000台突破!ノイエクラッセ時代の幕開け
  • 【衝撃】日産「フェアレディZ NISMO」中国投入へ…“日本の魂”が海を渡る
  • 「ATの寿命を縮める!?」…専門家が警告する“やってはいけない5つの習慣”
  • 「狩りのように徐々に心理を操る」…“元ロシアスパイ”が公開した、機密情報を盗む手口とは?
  • 【野望炸裂】中国の6世代戦闘機「J-36」、排気ノズル&吸気口を大改修!ステルス性能と機動性を両立か
  • 米グーグル、四半期売上高ついに1,000億ドル突破!“史上初の快挙”に世界が驚いた
  • 「関税250%で脅した」トランプ氏、“インド・パキスタン休戦”裏話を披露!インド政府は即反発

こんな記事も読まれています

  • 【JMS2025】日産「サクラ」が太陽光で一年間最大3,000km!“自ら充電する”軽EVへ進化
  • 「BMW iX3旋風?」…6週間で3,000台突破!ノイエクラッセ時代の幕開け
  • 【衝撃】日産「フェアレディZ NISMO」中国投入へ…“日本の魂”が海を渡る
  • 「ATの寿命を縮める!?」…専門家が警告する“やってはいけない5つの習慣”
  • 「狩りのように徐々に心理を操る」…“元ロシアスパイ”が公開した、機密情報を盗む手口とは?
  • 【野望炸裂】中国の6世代戦闘機「J-36」、排気ノズル&吸気口を大改修!ステルス性能と機動性を両立か
  • 米グーグル、四半期売上高ついに1,000億ドル突破!“史上初の快挙”に世界が驚いた
  • 「関税250%で脅した」トランプ氏、“インド・パキスタン休戦”裏話を披露!インド政府は即反発

おすすめニュース

  • 1
    「妻なしでは生きられない...」90代夫婦、手を取り合い“尊厳死”で最期を迎える

    トレンド 

  • 2
    「パンに生ゴキブリ混入!」中国人気パンに衝撃事件、消費者激怒もメーカーは“補償拒否”

    トレンド 

  • 3
    「機内で寝ている乗客をフォークで刺傷」...元神学生のインド人、機内凶行でフライト中断!

    トレンド 

  • 4
    「時速160キロで高齢者施設に激突!」試乗を口実に車を盗んだ20代、暴走の末の大惨事

    トレンド 

  • 5
    「これで156人目の犠牲...」麻薬犯罪を追った記者、無残な遺体で発見!麻薬カルテルの“報復”か

    トレンド 

話題

  • 1
    「ヘリコプターからキリンに銃乱射...」世界1位ユーチューバーの過激動画が「よくやった」と称賛されるワケ

    トレンド 

  • 2
    「会社の金を盗む気満々」AIが作った“偽領収書”に企業が次々と騙される衝撃の実態

    トレンド 

  • 3
    「コンコルド超えの静音技術」!NASA開発、静かな超音速旅客機“X-59”初飛行成功

    フォトニュース 

  • 4
    同居女性を殺害し自宅に“セメント埋葬”…16年間隠していた男を逮捕

    トレンド 

  • 5
    TXT、13作連続オリコン1位!『Starkissed』でキャリアハイ&日本5大ドーム制覇へ!

    K-POP 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]