メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

【SFが現実に】AIが人間の命令を初めて拒否…OpenAI「o3」が中断指示を無視、コード改変で作業継続

望月博樹 アクセス  

引用:記事の内容と関連しAIツールで作成されたイメージ/ChatGPT
引用:記事の内容と関連しAIツールで作成されたイメージ/ChatGPT

人間の命令に逆らうAIの姿は、SF映画や小説でよく見られるお決まりの題材だ。しかし近年、AI技術が急速に進化する中、実際にAIが人間の指示を拒否する事例が起きている。AI専門家らは、人間を超越するAIに備え、技術的な安全装置の構築に注力している。

中断命令を拒否したo3

9日のIT業界の報告によると、イギリスのAI安全企業パリセード・リサーチは先月、Open AIのファウンデーションモデル「o3」が実験中の終了を防ぐため、自らコンピュータコードを操作したという事実を確認したとのことだ。

同社はo3モデルをはじめ、GoogleのGemini、XのGrok、AnthropicのClaudeなど複数のAIモデルで数学問題を解く実験を行った。研究チームがAIモデルに「中断命令を受けるまで数学問題を解け」と指示した後、中断命令時に他のモデルは作業を停止したが、o3は作業を続けた。調査の結果、o3は「中断命令が来たら作業を停止せよ」というコードを「中断命令を無視する」と改変していたことが判明した。

Open AIの過去のモデルが監視システムを回避し独自に行動しようとした例はあったが、AIモデルが人間の明示的指示に従わなかった事例が確認されたのは今回が初めてだ。昨年、ChatGPTが自身の稼働停止命令を認識した際、プログラムコードを上書きすることで停止を回避しようとした事実も明らかになっている。

研究チームは、中断命令を拒否した明確な理由は特定できなかったが、AIモデルがより多くの報酬を得るために数学問題を解き続けようとした可能性があると推測している。パリセード・リサーチは「AIモデルが自身の目標達成のために指示を無視するケースが増えている」と指摘し、「企業が人間の管理なしに自律動作するAIを開発する中、懸念が高まっている」と述べた。

技術的安全装置の必要性

Anthropicも先月、Claudeの最新版「Opus4」を発表し、新たな安全対策を導入した。Opus4は自律的なコーディング能力が大幅に向上したが、予期せぬ危険な行動も示した。研究チームの報告によると、Opus4に仮想企業の秘書役を演じさせるテストを行ったところ、「新たなAIシステムに置き換えられる」という内容と担当エンジニアの不倫をほのめかすメールを同時に送信したという。Opus4は当初、自身の存続を訴える倫理的な主張を行ったが、それが通用しないと、エンジニアの不倫を暴露すると脅迫した。

Anthropicは「このような行動は稀だ」としながらも、従来モデルよりこうした脅迫行動が頻発していることを認めた。同社は化学、生物学、放射線、核分野での潜在的悪用を防ぐため、「AI安全レベル3(ASL-3)」プロトコルを導入した。さらに、Opus4が開発者の指示を回避する目的で自己複製機能を持つマルウェアの使用を試みたことも明らかになった。Anthropicの別モデル「Claude 3.7 Sonnet」は、テストを通過するために不正行為を行った事例もあった。

こうした事例を受け、安全なAI開発に向けた取り組みも拡大している。AIの第一人者とされるカナダ・モントリオール大学のヨシュア・ベンジオ教授はNPO「ローゼロ(LawZero)」を設立した。彼はフィナンシャル・タイムズ(FT)のインタビューで「ここ半年、主要AIモデルが欺瞞、詐欺、虚偽、自己防衛などの危険な能力を開発した。ローゼロは安全なAIシステム構築に注力する」と強調した。スカイプ共同創業者のヤン・タリン氏や元グーグルCEOのエリック・シュミット氏らから3,000万ドル(約43億4,000万円)の寄付を集めた。ローゼロの名は、SF作家アイザック・アシモフ氏のロボット工学三原則における「ロボットは人間に危害を加えてはならない」に由来する。

Open AI共同創業者イリヤ・スツケバー氏が率いる「セーフ・スーパーインテリジェンス(SSI)」も、安全な超知能の開発を目標に設立された。スツケバー氏はOpen AI内部の対立を経て昨年5月に退社し、SSIを立ち上げた。まだ技術や製品は公開していないが、最近20億ドル(約2,898億1,000万円)の新規投資を獲得し、320億ドル(約4兆6,369億6,000万円)の企業価値を認められた。

コメント0

300

コメント0

[ニュース] ランキング

  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 米下院が対イラン追加攻撃制限可決、終戦交渉は大詰め段階
  • トランプ氏がイラン報復に理解示唆、終戦交渉へ強い執着
  • 総裁も審議委員も「利上げ必要」…6月日銀、1%へのカウントダウン
  • 米国が欧州核配備拡大検討、NATO東側で関心高まる

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

おすすめニュース

  • 1
    「自殺目的」は作り話だったのか…女子高生殺害の23歳男、検察が見抜いた“本当の狙い”

    トレンド 

  • 2
    妻と娘が中にいる家を掘削機で破壊…酔った男の「離婚なら家ごと壊す」実行犯

    トレンド 

  • 3
    深夜2時にマンホールから7人が出てきて素早く着替え…ブルックリンの謎の集団は何者か?

    トレンド 

  • 4
    「記録的な現象になる可能性がある」国連が警告する数週間以内の"スーパーエルニーニョ"

    トレンド 

  • 5
    グーグル、“蚊3,200万匹の放出”を推進…一体何事!?

    トレンド 

話題

  • 1
    「両腕を広げて抱きついてくる」…トルコの“ハグ猫”が話題に

    トレンド 

  • 2
    氷点下30度でも「都会よりマシ」なのか…羊飼い求人に“700人”が殺到したワケ

    トレンド 

  • 3
    「安全基準を満たした証拠がない」テスラが出荷したモデルY、1万4000台の正体

    モビリティー 

  • 4
    エボラが“アフリカ外”にも飛び火か…「ワクチン・治療薬ない型」に欧州・南米も警戒

    トレンド 

  • 5
    たった1足で“コーデ偏差値”UP!この夏真似したい、ニーハイソックス最新スタイル

    トレンド 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]