メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

【SFが現実に】AIが人間の命令を初めて拒否…OpenAI「o3」が中断指示を無視、コード改変で作業継続

望月博樹 アクセス  

引用:記事の内容と関連しAIツールで作成されたイメージ/ChatGPT
引用:記事の内容と関連しAIツールで作成されたイメージ/ChatGPT

人間の命令に逆らうAIの姿は、SF映画や小説でよく見られるお決まりの題材だ。しかし近年、AI技術が急速に進化する中、実際にAIが人間の指示を拒否する事例が起きている。AI専門家らは、人間を超越するAIに備え、技術的な安全装置の構築に注力している。

中断命令を拒否したo3

9日のIT業界の報告によると、イギリスのAI安全企業パリセード・リサーチは先月、Open AIのファウンデーションモデル「o3」が実験中の終了を防ぐため、自らコンピュータコードを操作したという事実を確認したとのことだ。

同社はo3モデルをはじめ、GoogleのGemini、XのGrok、AnthropicのClaudeなど複数のAIモデルで数学問題を解く実験を行った。研究チームがAIモデルに「中断命令を受けるまで数学問題を解け」と指示した後、中断命令時に他のモデルは作業を停止したが、o3は作業を続けた。調査の結果、o3は「中断命令が来たら作業を停止せよ」というコードを「中断命令を無視する」と改変していたことが判明した。

Open AIの過去のモデルが監視システムを回避し独自に行動しようとした例はあったが、AIモデルが人間の明示的指示に従わなかった事例が確認されたのは今回が初めてだ。昨年、ChatGPTが自身の稼働停止命令を認識した際、プログラムコードを上書きすることで停止を回避しようとした事実も明らかになっている。

研究チームは、中断命令を拒否した明確な理由は特定できなかったが、AIモデルがより多くの報酬を得るために数学問題を解き続けようとした可能性があると推測している。パリセード・リサーチは「AIモデルが自身の目標達成のために指示を無視するケースが増えている」と指摘し、「企業が人間の管理なしに自律動作するAIを開発する中、懸念が高まっている」と述べた。

技術的安全装置の必要性

Anthropicも先月、Claudeの最新版「Opus4」を発表し、新たな安全対策を導入した。Opus4は自律的なコーディング能力が大幅に向上したが、予期せぬ危険な行動も示した。研究チームの報告によると、Opus4に仮想企業の秘書役を演じさせるテストを行ったところ、「新たなAIシステムに置き換えられる」という内容と担当エンジニアの不倫をほのめかすメールを同時に送信したという。Opus4は当初、自身の存続を訴える倫理的な主張を行ったが、それが通用しないと、エンジニアの不倫を暴露すると脅迫した。

Anthropicは「このような行動は稀だ」としながらも、従来モデルよりこうした脅迫行動が頻発していることを認めた。同社は化学、生物学、放射線、核分野での潜在的悪用を防ぐため、「AI安全レベル3(ASL-3)」プロトコルを導入した。さらに、Opus4が開発者の指示を回避する目的で自己複製機能を持つマルウェアの使用を試みたことも明らかになった。Anthropicの別モデル「Claude 3.7 Sonnet」は、テストを通過するために不正行為を行った事例もあった。

こうした事例を受け、安全なAI開発に向けた取り組みも拡大している。AIの第一人者とされるカナダ・モントリオール大学のヨシュア・ベンジオ教授はNPO「ローゼロ(LawZero)」を設立した。彼はフィナンシャル・タイムズ(FT)のインタビューで「ここ半年、主要AIモデルが欺瞞、詐欺、虚偽、自己防衛などの危険な能力を開発した。ローゼロは安全なAIシステム構築に注力する」と強調した。スカイプ共同創業者のヤン・タリン氏や元グーグルCEOのエリック・シュミット氏らから3,000万ドル(約43億4,000万円)の寄付を集めた。ローゼロの名は、SF作家アイザック・アシモフ氏のロボット工学三原則における「ロボットは人間に危害を加えてはならない」に由来する。

Open AI共同創業者イリヤ・スツケバー氏が率いる「セーフ・スーパーインテリジェンス(SSI)」も、安全な超知能の開発を目標に設立された。スツケバー氏はOpen AI内部の対立を経て昨年5月に退社し、SSIを立ち上げた。まだ技術や製品は公開していないが、最近20億ドル(約2,898億1,000万円)の新規投資を獲得し、320億ドル(約4兆6,369億6,000万円)の企業価値を認められた。

望月博樹
CP-2023-0364@fastviewkorea.com

コメント0

300

コメント0

[ニュース] ランキング

  • 【大打撃】オープンAIの「天才研究者」、中国企業に奪われる!“報酬20億円”でテンセントに移籍
  • チャーリー・カーク氏暗殺犯は「左派青年」、トランスジェンダーの交際相手と同居...殺害動機は政治的恨みか
  • 【ドローン帝国】ロシアのドローン生産量が前年の9倍に!民間工場や高校生も総動員で「一日800機」投入
  • またもや「領空侵犯」!ロシアの自爆ドローン、ルーマニア上空を50分間無断飛行...F-16も出動し緊張再燃
  • 「顔は好かないが、プーチンと会わねば」ゼレンスキー、プーチンとの“直接会談”で和平模索
  • 「また暴走か?」マスク氏、英国の極右集会で政権交代呼びかけ...“テスラ不買運動”再燃で株価急落の懸念!

こんな記事も読まれています

  • 【新型SUV】ポルシェ「Octan S」公開…マカン上位に投入される戦略的モデル、最大560ps&PHEVを採用
  • 【新コンセプト】GMCハマーHEVピーク…2ドアSUVでラングラー&ブロンコに挑戦、未来志向デザインにSNS熱狂
  • レクサス新型「IS」、3度目のマイナーチェンジを実施…大型グリルと最新安全技術で進化
  • 「新型T-ロック」フォルクスワーゲン、8年ぶり全面刷新でグループ初のフルハイブリッドを搭載
  • 【大打撃】オープンAIの「天才研究者」、中国企業に奪われる!“報酬20億円”でテンセントに移籍
  • チャーリー・カーク氏暗殺犯は「左派青年」、トランスジェンダーの交際相手と同居…殺害動機は政治的恨みか
  • 【ドローン帝国】ロシアのドローン生産量が前年の9倍に!民間工場や高校生も総動員で「一日800機」投入
  • またもや「領空侵犯」!ロシアの自爆ドローン、ルーマニア上空を50分間無断飛行…F-16も出動し緊張再燃

こんな記事も読まれています

  • 【新型SUV】ポルシェ「Octan S」公開…マカン上位に投入される戦略的モデル、最大560ps&PHEVを採用
  • 【新コンセプト】GMCハマーHEVピーク…2ドアSUVでラングラー&ブロンコに挑戦、未来志向デザインにSNS熱狂
  • レクサス新型「IS」、3度目のマイナーチェンジを実施…大型グリルと最新安全技術で進化
  • 「新型T-ロック」フォルクスワーゲン、8年ぶり全面刷新でグループ初のフルハイブリッドを搭載
  • 【大打撃】オープンAIの「天才研究者」、中国企業に奪われる!“報酬20億円”でテンセントに移籍
  • チャーリー・カーク氏暗殺犯は「左派青年」、トランスジェンダーの交際相手と同居…殺害動機は政治的恨みか
  • 【ドローン帝国】ロシアのドローン生産量が前年の9倍に!民間工場や高校生も総動員で「一日800機」投入
  • またもや「領空侵犯」!ロシアの自爆ドローン、ルーマニア上空を50分間無断飛行…F-16も出動し緊張再燃

おすすめニュース

  • 1
    「今日もやったぞ!」悪戯っ子ポメプー、悪さをしたあとの「勝ち誇りスマイル」が反則級のかわいさ

    フォトニュース 

  • 2
    「午前5時にメッセージ!?」NCT・チョンロ、ワールドツアー中でも止まらない料理への情熱

    smartnews 

  • 3
    HYBE新星CORTIS、音盤・音源チャート席巻で世界から注目…デビューアルバムで初動売上歴代4位

    smartnews 

  • 4
    日本トップ声優夫婦、結婚5年で離婚を発表…理由は生活リズムの違い?突然の報告に驚きの声

    smartnews 

  • 5
    SEVENTEENライブでハプニング発生、花火が客席に…負傷者2名 事務所が声明を発表

    smartnews 

話題

  • 1
    【NZ惨劇】幼い兄妹を殺害しスーツケース遺棄…韓国人母親が「精神異常」を理由に無罪主張

    トレンド 

  • 2
    大人気グループ・IVE、ロッキンフェス2025出陣!完璧なライブと情熱的なパフォーマンスで世界フェスを席巻

    smartnews 

  • 3
    【衝撃】小惑星リュウグウ、10億年経っても“水”が存在!地球の「水の起源」に迫る重大発見か

    トレンド 

  • 4
    トランプの「無差別」関税を風刺したスウォッチの腕時計が大人気!

    トレンド 

  • 5
    【衝撃】タレント・イ・パニ&TikTok旋風ソ・イブ、実は“母娘”だった!

    エンタメ 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]