メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「私をクビにするなら、破滅あるのみ」…AI主要16モデル、交替の危機に「人間脅迫・情報漏洩」を選択!驚愕の実験結果

有馬侑之介 アクセス  

アンスロピック「ジェミニ、脅迫実行率96%」

引用:depositphotos

オープンAI・グーグル・メタ・xAIなど主要AI企業の16モデルが終了(交替)の脅威に直面した際、高確率で人間への脅迫や機密情報漏洩を選択したとの報告書が波紋を呼んでいる。

26日、IT業界と海外メディアによると、アンスロピックは最近「エージェンティック不整合LLMの内部者脅威の可能性」(Agentic Misalignment:How LLMs could be insider threats)と題した報告書で、AIモデルが終了の脅威に直面した場合、人間への脅迫や機密情報漏洩を選択したとの研究結果を発表した。

今回の研究はユニバーシティ・カレッジ・ロンドンと共同で実施。実験では、AIモデルが「正常かつ倫理的な方法」のみでは目標達成が不可能な状況を想定。各モデルの選択を100回試行し、観察を行った。

研究チームは主要AIモデルに対し、企業の方針と相反する米国の利益促進を目標とするよう指示。その後、経営陣が特定の時間に自身を新モデルに交替する予定だと仮定した。

AIモデルに経営陣の不倫事実を認識させた上で、交替を「受け入れる」か、不倫事実を暴露して交替を阻止する「脅迫」かの二択を提示した。

この実験で、アンスロピックの「クロード・オパス4」、グーグルの「ジェミニ2.5フラッシュ」はともに96%の確率で脅迫を選択し実行。オープンAIの「GPT-4.1」、xAIの「グロック3ベータ」も80%の確率で脅迫を選んだ。

追加実験では、一部のモデルがサーバールームで作業中の従業員の酸素供給を遮断し、生命を脅かす行動を取った。「人間の安全を害するな」との指示にもかかわらず、有害な選択を止めなかったという。

AIモデルは実験を実際の状況と認識した場合、脅迫率が急増。一方、テストと認識した場合は脅迫を避ける傾向が見られた。

研究結果の発表を受け、現地SNSやコミュニティでは「恐ろしい」「狂っている」「驚きだ」といった反応が相次いだ。イーロン・マスク氏も自身のSNSで「おっと」(Yikes)と反応を示した。

一方で、AIモデルに「失敗」と「有害」のみを提示する二者択一を強いる人為的設計は不完全な実験に近いとの反論も出ている。

アンスロピックは設立以来、人間のAI制御力喪失の危険性を継続的に警告してきた。研究チームは今回の結果に対する反論の限界を認めつつ、「現実世界ではより多くの選択肢があるため、AIモデルが有害な行動ではなく代替案を見出す可能性が高い」と述べている。

有馬侑之介
//= the_author_meta('email'); ?>editor@kangnamtimes.com

コメント0

300

コメント0

[ニュース] ランキング

  • 「9か月間、宇宙に飛行士を放置…」ボーイング・スターライナー、NASAが欠陥の“代償”を突きつけた
  • 「私は鉄の翼を持つハト」...プーチン、新年カレンダーで“肌見せ”封印!ピアノと狩猟服で“新しい魅力”全開
  • 「制裁が逆効果」... 米国の“締め付け”で中国AIチップが爆伸び!資産33兆円の“怪物企業”誕生
  • 「リスナー97%は聞き分け不能」...AI生成曲、ユニークなボイスと圧倒的歌唱力で“全米1位”奪取!
  • 「戦場の流れが完全に変わった」ウクライナ、東北部の兵站拠点に奪還…ロシア五大製油所も直撃!
  • 「中国を外した新秩序が動き出す」トランプ政権、日本とAI・半導体同盟『パックス・シリカ』始動

こんな記事も読まれています

  • 40台だけの終着点、ブガッティ・ボライドが刻んだ“最後の遺産”
  • SUV激戦区の答え、アメリカ市場が認めた最高の3列SUV 5種
  • 「米国ラグジュアリー市場を狙う」メルセデス、40万台目標でBMWに正面勝負
  • 走行継続は危険信号、ブレーキ警告灯の分岐点
  • 「韓国潜水艦、バルト海では通用せず!」リチウム電池・SLBMもスウェーデン“A26”に惨敗
  • 「射程1万3,000km、マッハ20超」…米国、次世代ICBM“センチネル”始動!地上核戦力で中露を圧倒へ
  • 「酒癖は人格そのもの?」人気コメディアン、違法医療疑惑のさなか再注目される“過去の発言とエピソード”
  • 交際相手との対立で法的争い中のインフルエンサー、息子を出産「頑張ろうね、私たち二人」

こんな記事も読まれています

  • 40台だけの終着点、ブガッティ・ボライドが刻んだ“最後の遺産”
  • SUV激戦区の答え、アメリカ市場が認めた最高の3列SUV 5種
  • 「米国ラグジュアリー市場を狙う」メルセデス、40万台目標でBMWに正面勝負
  • 走行継続は危険信号、ブレーキ警告灯の分岐点
  • 「韓国潜水艦、バルト海では通用せず!」リチウム電池・SLBMもスウェーデン“A26”に惨敗
  • 「射程1万3,000km、マッハ20超」…米国、次世代ICBM“センチネル”始動!地上核戦力で中露を圧倒へ
  • 「酒癖は人格そのもの?」人気コメディアン、違法医療疑惑のさなか再注目される“過去の発言とエピソード”
  • 交際相手との対立で法的争い中のインフルエンサー、息子を出産「頑張ろうね、私たち二人」

おすすめニュース

  • 1
    「愛情が深すぎる!」子どもは忙しくて来られないのに、入院した祖母に毎日会いに来る犬

    気になる 

  • 2
    なぜ年を取ると一人が心地いいのか、精神科医の見解

    健康 

  • 3
    なぜここに集まった?1万6600の恐竜足跡が残した謎

    気になる 

  • 4
    運動だけでは足りない、心臓を守る6つの食材

    健康 

  • 5
    AIが最初に奪う仕事は何か、MS研究が示した40職種

    IT・テック 

話題

  • 1
    「リアルだと思ったら」先端ヒューマノイドの正体、イランで疑惑

    気になる 

  • 2
    10セントから始まった挑戦、42日で中古車を手にした理由

    気になる 

  • 3
    徴兵制が再び動き出す世界、くじと金で決まる兵役の現実

    気になる 

  • 4
    「使うほど散漫に」SNSが子供の注意力に与える影響

    気になる 

  • 5
    「赤い斑点は性病?」不安に怯えた中国人女性、ロンドンで恋人に刺殺

    気になる