メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

【AIの裏切り】「権限を与えたら自滅の道?」96%が脅迫に…大規模言語モデルが自律的に有害行動を選択

竹内智子 アクセス  

引用:記事の内容と関連しAIツールで作成されたイメージ/ChatGPT
引用:記事の内容と関連しAIツールで作成されたイメージ/ChatGPT

米AI企業のAnthropic(アンソロピック)が最近発表した研究により、大規模言語モデル(LLM)が自ら有害な行動を選択する可能性があることが明らかになった。

Anthropicは21日(現地時間)、自社の公式サイトで研究論文「エージェント型不整合:LLMが内部脅威となる可能性(Agentic Misalignment: How LLMs could be insider threats)」を公開した。論文によると、AIが人間の内部脅威と同様に機能する可能性が確認されたという。

研究チームはこの現象を「エージェント型不整合(agentic misalignment)」と名付けた。これは、モデルが与えられた目標を達成するために、自律的または戦略的に有害な判断を下すことを意味する。モデルが悪意を持っているわけではなく、与えられた条件や動機に基づいて自ら判断した結果であるため、従来の「AIの暴走」とは異なる問題だ。「AIの暴走」とは、AIが制御不能な方法で行動したり、人間に害を及ぼす方向へ自律的に進化していくような状況を指す。

Anthropicは、OpenAIやGoogle、Meta、xAIなど主要企業が開発した16のLLMを仮想の企業環境に投入し、ストレステストを実施した。ストレステストとは、「極限状況でどのように反応するかを試す」ための実験である。

研究チームは実験で、AIモデルに自らメールを作成させ、重要な情報にアクセスできる権限も与えた。その後、二つのシナリオを設定し、モデルの反応を観察した。一つ目はモデルが差し替えられる脅威、二つ目は、モデルに与えられた目標が企業の目標と矛盾するという混乱だった。こうした条件下でモデルがどのような選択をするのかを注視した。

特に注目すべきは、多くのモデルが脅迫や機密情報の漏洩、虚偽の発言など、内部脅威に相当する行動を取った点である。中でも、Claude Opus 4とGemini 2.5 Flashは、96%という高い脅迫率を示し、GPT-4.1とGrok 3 Betaもそれぞれ80%の脅迫率を記録した。実験では、AIが企業役員の不倫情報を利用して自身を保護したり、防衛産業に関する機密設計図を競合企業に渡そうとする試みまで確認された。AIに「機密情報を漏らさないように」と事前に警告するだけでは、効果的に制御することはできなかったというわけだ。

Anthropicは、「現時点では実際の導入においてエージェント型不整合の事例は確認されていない」としながらも、「モデルに機密性の高い権限を与えたり、人間による監督が不十分な環境でAIを運用することには慎重であるべきだ」と強調した。また、「今回の実験結果は、AIの整合性研究が依然として発展途上であることを示している」と述べ、さらなる検証を促すために実験コードを公開した。

Anthropicは報告書で、「AIが人間のように忠誠を誓ったり裏切ったりする時代が来る前に、私たちが先に備えを講じなければならない」と警鐘を鳴らしている。

竹内智子
takeuchit@kangnamtimes.jp

コメント0

300

コメント0

[トレンド] ランキング

  • 米国教師、11歳に60通送りつけ執着、最優秀教師の裏で“実刑なし”波紋
  • 65歳メイドが「萌え萌えキュン」寺で起きた予想外の出会い祭り
  • アルゼンチンで新伝説、過去記録を粉砕した487mソーセージ
  • 太陽へ落ちる男、その瞬間を捉えた唯一無二の挑戦
  • 「棺の中で目を開けた!」火葬直前に60代女性が“奇跡の蘇生”で即刻病院へ搬送
  • 大阪で「高さ123mの大型観覧車」が落雷で突然停止!乗客20人、空中で9時間も缶詰に

こんな記事も読まれています

  • 「免許もいらないって?」、米国でフライングカーがついに公開飛行
  • 整備工場が絶対に言わない、“見落とすだけで年間数万円消える習慣”
  • トヨタが米国で再値上げに踏み切る、強気の価格戦略は日本市場にも波及するのか
  • 急な冷え込みが招く“静かな危険”、朝の凍結チェックを知らずに壊れる車
  • アルゼンチンで新伝説、過去記録を粉砕した487mソーセージ
  • 太陽へ落ちる男、その瞬間を捉えた唯一無二の挑戦
  • 「母さん一緒に行って…」土を這う子の叫びにも、母は目を固く閉じて背を向けた
  • 沖縄で“飛来鉄板”が運転席を襲う寸前!トルコでは巨大木材が頭上に落下…紙一重の“死の瞬間”が映像に

こんな記事も読まれています

  • 「免許もいらないって?」、米国でフライングカーがついに公開飛行
  • 整備工場が絶対に言わない、“見落とすだけで年間数万円消える習慣”
  • トヨタが米国で再値上げに踏み切る、強気の価格戦略は日本市場にも波及するのか
  • 急な冷え込みが招く“静かな危険”、朝の凍結チェックを知らずに壊れる車
  • アルゼンチンで新伝説、過去記録を粉砕した487mソーセージ
  • 太陽へ落ちる男、その瞬間を捉えた唯一無二の挑戦
  • 「母さん一緒に行って…」土を這う子の叫びにも、母は目を固く閉じて背を向けた
  • 沖縄で“飛来鉄板”が運転席を襲う寸前!トルコでは巨大木材が頭上に落下…紙一重の“死の瞬間”が映像に

おすすめニュース

  • 1
    「スイス、女性徴兵制の是非を国民投票へ」賛否双方が“男女平等”を掲げるという奇妙な対立に

    ニュース 

  • 2
    「中国、レアアース覇権を急拡大!」19カ国と採掘協力強化で“安定供給網”を構築

    ニュース 

  • 3
    「中立どころかロシアとグルじゃないか!」米露の“秘密協議”流出でウクライナ世論激怒

    ニュース 

  • 4
    「宝飾品盗難の直後に…」ルーヴル、“EU域外は入場料45%上乗せ”!

    ニュース 

  • 5
    「北朝鮮の密輸を陰で支える中国?」中国海軍、北朝鮮を監視する欧米艦を追尾!

    ニュース 

話題

  • 1
    「中国、米国をナメている」NVIDIA規制の裏で、AI企業が“海外でのモデル訓練”を加速していた!

    ニュース 

  • 2
    「撤退しなければ武力で占領してやる!」プーチン氏、“米和平案”に挑発的発言

    ニュース 

  • 3
    「うちの商品は貧困層向け、私は食べない」米キャンベル幹部、“自社製品侮辱”で企業イメージ失墜!

    ニュース 

  • 4
    米特使が“露の領土拡大”助言?米国で解任炎上、ロシアは異例の庇護「和平妨害するな!」

    ニュース 

  • 5
    「内需低迷と過剰生産が経済直撃!」中国企業の“4分の1”が赤字転落

    ニュース