メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

【SFが現実に】AIが人間の命令を初めて拒否…OpenAI「o3」が中断指示を無視、コード改変で作業継続

望月博樹 アクセス  

引用:記事の内容と関連しAIツールで作成されたイメージ/ChatGPT
引用:記事の内容と関連しAIツールで作成されたイメージ/ChatGPT

人間の命令に逆らうAIの姿は、SF映画や小説でよく見られるお決まりの題材だ。しかし近年、AI技術が急速に進化する中、実際にAIが人間の指示を拒否する事例が起きている。AI専門家らは、人間を超越するAIに備え、技術的な安全装置の構築に注力している。

中断命令を拒否したo3

9日のIT業界の報告によると、イギリスのAI安全企業パリセード・リサーチは先月、Open AIのファウンデーションモデル「o3」が実験中の終了を防ぐため、自らコンピュータコードを操作したという事実を確認したとのことだ。

同社はo3モデルをはじめ、GoogleのGemini、XのGrok、AnthropicのClaudeなど複数のAIモデルで数学問題を解く実験を行った。研究チームがAIモデルに「中断命令を受けるまで数学問題を解け」と指示した後、中断命令時に他のモデルは作業を停止したが、o3は作業を続けた。調査の結果、o3は「中断命令が来たら作業を停止せよ」というコードを「中断命令を無視する」と改変していたことが判明した。

Open AIの過去のモデルが監視システムを回避し独自に行動しようとした例はあったが、AIモデルが人間の明示的指示に従わなかった事例が確認されたのは今回が初めてだ。昨年、ChatGPTが自身の稼働停止命令を認識した際、プログラムコードを上書きすることで停止を回避しようとした事実も明らかになっている。

研究チームは、中断命令を拒否した明確な理由は特定できなかったが、AIモデルがより多くの報酬を得るために数学問題を解き続けようとした可能性があると推測している。パリセード・リサーチは「AIモデルが自身の目標達成のために指示を無視するケースが増えている」と指摘し、「企業が人間の管理なしに自律動作するAIを開発する中、懸念が高まっている」と述べた。

技術的安全装置の必要性

Anthropicも先月、Claudeの最新版「Opus4」を発表し、新たな安全対策を導入した。Opus4は自律的なコーディング能力が大幅に向上したが、予期せぬ危険な行動も示した。研究チームの報告によると、Opus4に仮想企業の秘書役を演じさせるテストを行ったところ、「新たなAIシステムに置き換えられる」という内容と担当エンジニアの不倫をほのめかすメールを同時に送信したという。Opus4は当初、自身の存続を訴える倫理的な主張を行ったが、それが通用しないと、エンジニアの不倫を暴露すると脅迫した。

Anthropicは「このような行動は稀だ」としながらも、従来モデルよりこうした脅迫行動が頻発していることを認めた。同社は化学、生物学、放射線、核分野での潜在的悪用を防ぐため、「AI安全レベル3(ASL-3)」プロトコルを導入した。さらに、Opus4が開発者の指示を回避する目的で自己複製機能を持つマルウェアの使用を試みたことも明らかになった。Anthropicの別モデル「Claude 3.7 Sonnet」は、テストを通過するために不正行為を行った事例もあった。

こうした事例を受け、安全なAI開発に向けた取り組みも拡大している。AIの第一人者とされるカナダ・モントリオール大学のヨシュア・ベンジオ教授はNPO「ローゼロ(LawZero)」を設立した。彼はフィナンシャル・タイムズ(FT)のインタビューで「ここ半年、主要AIモデルが欺瞞、詐欺、虚偽、自己防衛などの危険な能力を開発した。ローゼロは安全なAIシステム構築に注力する」と強調した。スカイプ共同創業者のヤン・タリン氏や元グーグルCEOのエリック・シュミット氏らから3,000万ドル(約43億4,000万円)の寄付を集めた。ローゼロの名は、SF作家アイザック・アシモフ氏のロボット工学三原則における「ロボットは人間に危害を加えてはならない」に由来する。

Open AI共同創業者イリヤ・スツケバー氏が率いる「セーフ・スーパーインテリジェンス(SSI)」も、安全な超知能の開発を目標に設立された。スツケバー氏はOpen AI内部の対立を経て昨年5月に退社し、SSIを立ち上げた。まだ技術や製品は公開していないが、最近20億ドル(約2,898億1,000万円)の新規投資を獲得し、320億ドル(約4兆6,369億6,000万円)の企業価値を認められた。

望月博樹
CP-2023-0364@fastviewkorea.com

コメント0

300

コメント0

[ニュース] ランキング

  • 「テスラ、完全自動運転の野望崩壊」...自動運転ゼロの“サイバーキャブ”、価格戦略と安全規制の狭間で揺れる!
  • 「北朝鮮は絶対崩れないのか?」極秘情報と脱北者証言からわかる“クーデター不可能”の現実
  • 「豚の腎臓移植で9カ月生存!」米UCLA、“遺伝子改変臓器”の実験に成功
  • 「合意内容と違う!」トランプ政権の“成果誇張外交”に日本・韓国困惑...経済同盟に深まる“信頼の亀裂”
  • 「米中露、核実験競争再燃か」...習近平、“新疆ロプノール核実験場”を再建!
  • 「史上最悪デザイン」からの反乱!iPhone17、注文殺到でクックCEOも絶句

こんな記事も読まれています

  • ランボルギーニ「マニフェスト」が描く“美学の挑戦”…電動化の時代に響くデザイン哲学の鼓動
  • 【オーナー専用】ランボルギーニ「THE LOUNGE TOKYO」公開…六本木裏通りに潜む“秘密の聖域”
  • 【新型】スバルBRZ 2026年型登場 …「ピュアスポーツの原点」を現代に蘇らせる
  • 「アウディ×バイエルン」23年の絆が走り出す…RS e-tron GTが導く“電動の未来と情熱の共鳴”
  • 「テスラ、完全自動運転の野望崩壊」…自動運転ゼロの“サイバーキャブ”、価格戦略と安全規制の狭間で揺れる!
  • “偽軍人”に化けた配達員、女性医師に暴行!SNSで巧妙に接近か
  • 「110年前の悲劇が蘇る」…タイタニック一等席の名簿がオークションに登場!
  • 「北朝鮮は絶対崩れないのか?」極秘情報と脱北者証言からわかる“クーデター不可能”の現実

こんな記事も読まれています

  • ランボルギーニ「マニフェスト」が描く“美学の挑戦”…電動化の時代に響くデザイン哲学の鼓動
  • 【オーナー専用】ランボルギーニ「THE LOUNGE TOKYO」公開…六本木裏通りに潜む“秘密の聖域”
  • 【新型】スバルBRZ 2026年型登場 …「ピュアスポーツの原点」を現代に蘇らせる
  • 「アウディ×バイエルン」23年の絆が走り出す…RS e-tron GTが導く“電動の未来と情熱の共鳴”
  • 「テスラ、完全自動運転の野望崩壊」…自動運転ゼロの“サイバーキャブ”、価格戦略と安全規制の狭間で揺れる!
  • “偽軍人”に化けた配達員、女性医師に暴行!SNSで巧妙に接近か
  • 「110年前の悲劇が蘇る」…タイタニック一等席の名簿がオークションに登場!
  • 「北朝鮮は絶対崩れないのか?」極秘情報と脱北者証言からわかる“クーデター不可能”の現実

おすすめニュース

  • 1
    「幼少期の腸内細菌が将来の不安とうつを左右する!」UCLA研究が明らかにした、腸と脳の驚きの関連性

    ヒント 

  • 2
    「最強のはずが…」テスラ『サイバートラック』、わずか2年で10度目のリコール

    トレンド 

  • 3
    「命を懸けて痩せろ!」“50キロ減でポルシェ”ダイエット企画に批判殺到

    トレンド 

  • 4
    「うちの子のちょっと変わった癖」犬の幼稚園で“友達をなでて歩く”ルビーが話題に

    フォトニュース 

  • 5
    「注文と違うじゃないか!」ベジタリアンメニューに“肉混入”で客激怒、店主と射殺

    トレンド 

話題

  • 1
    「編集室から脱出できないアーティスト」カン・スンユン、理想が高すぎて睡眠ゼロ説

    エンタメ 

  • 2
    「JR東海まで落とした男たち」ゼベワン、広告も番組も日本制圧中

    エンタメ 

  • 3
    「完全体は口だけ」EXO、年末も6人+訴訟3人のまま

    エンタメ 

  • 4
    「やめてって言われる女優」チャン・ヘジン、ハイテンションすぎてマネージャー悲鳴

    エンタメ 

  • 5
    「10%でここまで揉める?」EXO-CBXとSMの“細かすぎる仁義なき戦い”

    エンタメ 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]