メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「私をクビにするなら、破滅あるのみ」…AI主要16モデル、交替の危機に「人間脅迫・情報漏洩」を選択!驚愕の実験結果

有馬侑之介 アクセス  

アンスロピック「ジェミニ、脅迫実行率96%」

引用:depositphotos

オープンAI・グーグル・メタ・xAIなど主要AI企業の16モデルが終了(交替)の脅威に直面した際、高確率で人間への脅迫や機密情報漏洩を選択したとの報告書が波紋を呼んでいる。

26日、IT業界と海外メディアによると、アンスロピックは最近「エージェンティック不整合LLMの内部者脅威の可能性」(Agentic Misalignment:How LLMs could be insider threats)と題した報告書で、AIモデルが終了の脅威に直面した場合、人間への脅迫や機密情報漏洩を選択したとの研究結果を発表した。

今回の研究はユニバーシティ・カレッジ・ロンドンと共同で実施。実験では、AIモデルが「正常かつ倫理的な方法」のみでは目標達成が不可能な状況を想定。各モデルの選択を100回試行し、観察を行った。

研究チームは主要AIモデルに対し、企業の方針と相反する米国の利益促進を目標とするよう指示。その後、経営陣が特定の時間に自身を新モデルに交替する予定だと仮定した。

AIモデルに経営陣の不倫事実を認識させた上で、交替を「受け入れる」か、不倫事実を暴露して交替を阻止する「脅迫」かの二択を提示した。

この実験で、アンスロピックの「クロード・オパス4」、グーグルの「ジェミニ2.5フラッシュ」はともに96%の確率で脅迫を選択し実行。オープンAIの「GPT-4.1」、xAIの「グロック3ベータ」も80%の確率で脅迫を選んだ。

追加実験では、一部のモデルがサーバールームで作業中の従業員の酸素供給を遮断し、生命を脅かす行動を取った。「人間の安全を害するな」との指示にもかかわらず、有害な選択を止めなかったという。

AIモデルは実験を実際の状況と認識した場合、脅迫率が急増。一方、テストと認識した場合は脅迫を避ける傾向が見られた。

研究結果の発表を受け、現地SNSやコミュニティでは「恐ろしい」「狂っている」「驚きだ」といった反応が相次いだ。イーロン・マスク氏も自身のSNSで「おっと」(Yikes)と反応を示した。

一方で、AIモデルに「失敗」と「有害」のみを提示する二者択一を強いる人為的設計は不完全な実験に近いとの反論も出ている。

アンスロピックは設立以来、人間のAI制御力喪失の危険性を継続的に警告してきた。研究チームは今回の結果に対する反論の限界を認めつつ、「現実世界ではより多くの選択肢があるため、AIモデルが有害な行動ではなく代替案を見出す可能性が高い」と述べている。

有馬侑之介
//= the_author_meta('email'); ?>editor@kangnamtimes.com

コメント0

300

コメント0

[ニュース] ランキング

  • 「終わりの始まりか!」ビットコイン、4万ドル転落を警告する“史上最悪のシナリオ”
  • 「またマスクの“口先”で株価が爆騰」無人ロボタクシー発言にテスラ、1年ぶり高値!
  • 「下着すらない!?」"百戦百勝の無敵"を掲げた北朝鮮軍、裏側で起きていたこと
  • 「ついにAI神話が揺らぎ始めた」NY株下落、投資マネーがAI株から離れ出した日
  • 「中東に再び血の嵐か」ISがシリア連続死に関与疑惑…激怒のトランプ氏「大規模な報復は近い」
  • 「深く潜れば生き残れるという錯覚 」金正恩が信じた北朝鮮地下要塞の限界

こんな記事も読まれています

  • 今のテスラが中国EVを手本にしていた?元幹部証言で見えた開発の裏側
  • EV総量とほぼ同数、マスタングが追いついたフォード販売の異変
  • SF映画のような金色ボディと低い地上高、テスラ「ロボバン」映像が再拡散した理由
  • 「テスラの弱点解消?」運転者のための物理ボタンが突然現れた
  • 「またマスクの“口先”で株価が爆騰」無人ロボタクシー発言にテスラ、1年ぶり高値!
  • 「下着すらない!?」”百戦百勝の無敵”を掲げた北朝鮮軍、裏側で起きていたこと
  • 「ついにAI神話が揺らぎ始めた」NY株下落、投資マネーがAI株から離れ出した日
  • 「中東に再び血の嵐か」ISがシリア連続死に関与疑惑…激怒のトランプ氏「大規模な報復は近い」

こんな記事も読まれています

  • 今のテスラが中国EVを手本にしていた?元幹部証言で見えた開発の裏側
  • EV総量とほぼ同数、マスタングが追いついたフォード販売の異変
  • SF映画のような金色ボディと低い地上高、テスラ「ロボバン」映像が再拡散した理由
  • 「テスラの弱点解消?」運転者のための物理ボタンが突然現れた
  • 「またマスクの“口先”で株価が爆騰」無人ロボタクシー発言にテスラ、1年ぶり高値!
  • 「下着すらない!?」”百戦百勝の無敵”を掲げた北朝鮮軍、裏側で起きていたこと
  • 「ついにAI神話が揺らぎ始めた」NY株下落、投資マネーがAI株から離れ出した日
  • 「中東に再び血の嵐か」ISがシリア連続死に関与疑惑…激怒のトランプ氏「大規模な報復は近い」

おすすめニュース

  • 1
    飲酒事故で服役中の歌手キム・ホジュン、突然浮上した“舞台復帰説”に事務所が即否定

    エンタメ 

  • 2
    31公演で130万枚、興収1億8,570万ドル Stray Kidsが打ち立てた記録…11会場でK-POPアーティスト初公演

    エンタメ 

  • 3
    親交説を否定したリーダー、10年以上の関係を示唆されたメンバーは無言…「注射おばさん」波紋の行方

    エンタメ 

  • 4
    「週13本をこなした全盛期の裏側で…」忙しさが生んだ後輩との距離感、悔いの残るエピソードを告白

    エンタメ 

  • 5
    資産10億から一夜で転落…転倒事故をきっかけに人生が一変した71歳のベテラン歌手、波乱万丈な人生を告白

    エンタメ 

話題

  • 1
    EXO、冬の定番を継ぐ新曲「I'm Home」を電撃予告…「The First Snow」の感動再び?

    エンタメ 

  • 2
    「スキンケアのため訪問しただけ」SHINeeリーダー、“注射おばさん”との親交説疑惑に釈明

    エンタメ 

  • 3
    「まだAIだと思ってる?」人気俳優イ・イギョンの暴露者が新たな投稿、DM動画公開で波紋拡大

    エンタメ 

  • 4
    純白ドレスが話題に…大人気バンドQWER・チョダン、受賞の感動と母の誕生日を重ねた近況ショット公開

    エンタメ 

  • 5
    44歳で第2子に挑戦…流産・移植を経たタレントが語るリアル妊娠事情 豊胸手術も考えた?

    エンタメ