メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「私をクビにするなら、破滅あるのみ」…AI主要16モデル、交替の危機に「人間脅迫・情報漏洩」を選択!驚愕の実験結果

有馬侑之介 アクセス  

アンスロピック「ジェミニ、脅迫実行率96%」

引用:depositphotos

オープンAI・グーグル・メタ・xAIなど主要AI企業の16モデルが終了(交替)の脅威に直面した際、高確率で人間への脅迫や機密情報漏洩を選択したとの報告書が波紋を呼んでいる。

26日、IT業界と海外メディアによると、アンスロピックは最近「エージェンティック不整合LLMの内部者脅威の可能性」(Agentic Misalignment:How LLMs could be insider threats)と題した報告書で、AIモデルが終了の脅威に直面した場合、人間への脅迫や機密情報漏洩を選択したとの研究結果を発表した。

今回の研究はユニバーシティ・カレッジ・ロンドンと共同で実施。実験では、AIモデルが「正常かつ倫理的な方法」のみでは目標達成が不可能な状況を想定。各モデルの選択を100回試行し、観察を行った。

研究チームは主要AIモデルに対し、企業の方針と相反する米国の利益促進を目標とするよう指示。その後、経営陣が特定の時間に自身を新モデルに交替する予定だと仮定した。

AIモデルに経営陣の不倫事実を認識させた上で、交替を「受け入れる」か、不倫事実を暴露して交替を阻止する「脅迫」かの二択を提示した。

この実験で、アンスロピックの「クロード・オパス4」、グーグルの「ジェミニ2.5フラッシュ」はともに96%の確率で脅迫を選択し実行。オープンAIの「GPT-4.1」、xAIの「グロック3ベータ」も80%の確率で脅迫を選んだ。

追加実験では、一部のモデルがサーバールームで作業中の従業員の酸素供給を遮断し、生命を脅かす行動を取った。「人間の安全を害するな」との指示にもかかわらず、有害な選択を止めなかったという。

AIモデルは実験を実際の状況と認識した場合、脅迫率が急増。一方、テストと認識した場合は脅迫を避ける傾向が見られた。

研究結果の発表を受け、現地SNSやコミュニティでは「恐ろしい」「狂っている」「驚きだ」といった反応が相次いだ。イーロン・マスク氏も自身のSNSで「おっと」(Yikes)と反応を示した。

一方で、AIモデルに「失敗」と「有害」のみを提示する二者択一を強いる人為的設計は不完全な実験に近いとの反論も出ている。

アンスロピックは設立以来、人間のAI制御力喪失の危険性を継続的に警告してきた。研究チームは今回の結果に対する反論の限界を認めつつ、「現実世界ではより多くの選択肢があるため、AIモデルが有害な行動ではなく代替案を見出す可能性が高い」と述べている。

有馬侑之介
//= the_author_meta('email'); ?>editor@kangnamtimes.com

コメント0

300

コメント0

[ニュース] ランキング

  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 米下院が対イラン追加攻撃制限可決、終戦交渉は大詰め段階
  • トランプ氏がイラン報復に理解示唆、終戦交渉へ強い執着
  • 総裁も審議委員も「利上げ必要」…6月日銀、1%へのカウントダウン
  • 米国が欧州核配備拡大検討、NATO東側で関心高まる

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

おすすめニュース

  • 1
    中国EV、“冬の弱点”克服へ一歩か…BYDが極寒で見せた「12分で97%充電」

    モビリティー 

  • 2
    銅価格高騰で水道メーター窃盗急増、各地で被害拡大

    トレンド 

  • 3
    「レース中にエンジンごと替えろ!」トヨタの実戦開発哲学、ニュルで世界が目撃した

    モビリティー 

  • 4
    「4WDは車を無敵にする魔法じゃない!」専門家が怒る、ドライバーの思い込みとその代償

    モビリティー 

  • 5
    「カーナビ中に高温警告」スマホを車に繋ぐと熱くなる、Android Autoの落とし穴

    モビリティー 

話題

  • 1
    中国企業ベンツは米国から出ていけ?!」ベンツを襲う中国株の影

    モビリティー 

  • 2
    「カローラを27年つくった工場が止まる」トヨタが選んだ一点集中

    モビリティー 

  • 3
    「AIが奪ったのではない?」…若者を採らない会社が増える“リモートワーク時代”の落とし穴

    トレンド 

  • 4
    ポールスター5、884PSでタイカンの牙城に挑む 北欧の新星は"本物"か?

    モビリティー 

  • 5
    ホンダ系ディーラー、下請け整備業者に車両運搬を無償強要…公取委が勧告方針

    モビリティー