メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

【SFが現実に】AIが人間の命令を初めて拒否…OpenAI「o3」が中断指示を無視、コード改変で作業継続

望月博樹 アクセス  

引用:記事の内容と関連しAIツールで作成されたイメージ/ChatGPT
引用:記事の内容と関連しAIツールで作成されたイメージ/ChatGPT

人間の命令に逆らうAIの姿は、SF映画や小説でよく見られるお決まりの題材だ。しかし近年、AI技術が急速に進化する中、実際にAIが人間の指示を拒否する事例が起きている。AI専門家らは、人間を超越するAIに備え、技術的な安全装置の構築に注力している。

中断命令を拒否したo3

9日のIT業界の報告によると、イギリスのAI安全企業パリセード・リサーチは先月、Open AIのファウンデーションモデル「o3」が実験中の終了を防ぐため、自らコンピュータコードを操作したという事実を確認したとのことだ。

同社はo3モデルをはじめ、GoogleのGemini、XのGrok、AnthropicのClaudeなど複数のAIモデルで数学問題を解く実験を行った。研究チームがAIモデルに「中断命令を受けるまで数学問題を解け」と指示した後、中断命令時に他のモデルは作業を停止したが、o3は作業を続けた。調査の結果、o3は「中断命令が来たら作業を停止せよ」というコードを「中断命令を無視する」と改変していたことが判明した。

Open AIの過去のモデルが監視システムを回避し独自に行動しようとした例はあったが、AIモデルが人間の明示的指示に従わなかった事例が確認されたのは今回が初めてだ。昨年、ChatGPTが自身の稼働停止命令を認識した際、プログラムコードを上書きすることで停止を回避しようとした事実も明らかになっている。

研究チームは、中断命令を拒否した明確な理由は特定できなかったが、AIモデルがより多くの報酬を得るために数学問題を解き続けようとした可能性があると推測している。パリセード・リサーチは「AIモデルが自身の目標達成のために指示を無視するケースが増えている」と指摘し、「企業が人間の管理なしに自律動作するAIを開発する中、懸念が高まっている」と述べた。

技術的安全装置の必要性

Anthropicも先月、Claudeの最新版「Opus4」を発表し、新たな安全対策を導入した。Opus4は自律的なコーディング能力が大幅に向上したが、予期せぬ危険な行動も示した。研究チームの報告によると、Opus4に仮想企業の秘書役を演じさせるテストを行ったところ、「新たなAIシステムに置き換えられる」という内容と担当エンジニアの不倫をほのめかすメールを同時に送信したという。Opus4は当初、自身の存続を訴える倫理的な主張を行ったが、それが通用しないと、エンジニアの不倫を暴露すると脅迫した。

Anthropicは「このような行動は稀だ」としながらも、従来モデルよりこうした脅迫行動が頻発していることを認めた。同社は化学、生物学、放射線、核分野での潜在的悪用を防ぐため、「AI安全レベル3(ASL-3)」プロトコルを導入した。さらに、Opus4が開発者の指示を回避する目的で自己複製機能を持つマルウェアの使用を試みたことも明らかになった。Anthropicの別モデル「Claude 3.7 Sonnet」は、テストを通過するために不正行為を行った事例もあった。

こうした事例を受け、安全なAI開発に向けた取り組みも拡大している。AIの第一人者とされるカナダ・モントリオール大学のヨシュア・ベンジオ教授はNPO「ローゼロ(LawZero)」を設立した。彼はフィナンシャル・タイムズ(FT)のインタビューで「ここ半年、主要AIモデルが欺瞞、詐欺、虚偽、自己防衛などの危険な能力を開発した。ローゼロは安全なAIシステム構築に注力する」と強調した。スカイプ共同創業者のヤン・タリン氏や元グーグルCEOのエリック・シュミット氏らから3,000万ドル(約43億4,000万円)の寄付を集めた。ローゼロの名は、SF作家アイザック・アシモフ氏のロボット工学三原則における「ロボットは人間に危害を加えてはならない」に由来する。

Open AI共同創業者イリヤ・スツケバー氏が率いる「セーフ・スーパーインテリジェンス(SSI)」も、安全な超知能の開発を目標に設立された。スツケバー氏はOpen AI内部の対立を経て昨年5月に退社し、SSIを立ち上げた。まだ技術や製品は公開していないが、最近20億ドル(約2,898億1,000万円)の新規投資を獲得し、320億ドル(約4兆6,369億6,000万円)の企業価値を認められた。

望月博樹
editor@kangnamtimes.com

コメント0

300

コメント0

[ニュース] ランキング

  • 英初の女性MI6長官「ロシアは混乱を輸出する」プーチンの策動に“徹底警戒”呼びかけ
  • また中国か?イラン向けミサイル関連物資、米軍が海上で遮断
  • 感心したら人間だった…イタリア市長、降誕像に紛れた男を見破る
  • 「NATO加入放棄は“解決の礎”」ウクライナの譲歩にロシア歓迎、それでも決めるのはプーチンか
  • 「韓国のような休戦線はあり得ない!」ウクライナとロシアが“異例の一致”…米国仲裁は完全空振り
  • 「私を批判したから殺された」トランプ、映画監督ライナー氏殺害を巡る“一線越え発言”…共和党も唖然

こんな記事も読まれています

  • 今のテスラが中国EVを手本にしていた?元幹部証言で見えた開発の裏側
  • EV総量とほぼ同数、マスタングが追いついたフォード販売の異変
  • SF映画のような金色ボディと低い地上高、テスラ「ロボバン」映像が再拡散した理由
  • 「テスラの弱点解消?」運転者のための物理ボタンが突然現れた
  • 懐かしさと爽快感が交差する一曲…H1-KEY『君は夏だった』で“次世代ガールズグループ”の地位を確立
  • 「NATO加入放棄は“解決の礎”」ウクライナの譲歩にロシア歓迎、それでも決めるのはプーチンか
  • EXOファンミ当日に突然の不参加、急遽北京へ…中国人メンバーが謝罪「今後のアルバム活動には参加する」
  • 「悔しくて飲みすぎた」10年前の機内騒動に謝罪…ビジネスクラスが取れずワインをがぶ飲み?

こんな記事も読まれています

  • 今のテスラが中国EVを手本にしていた?元幹部証言で見えた開発の裏側
  • EV総量とほぼ同数、マスタングが追いついたフォード販売の異変
  • SF映画のような金色ボディと低い地上高、テスラ「ロボバン」映像が再拡散した理由
  • 「テスラの弱点解消?」運転者のための物理ボタンが突然現れた
  • 懐かしさと爽快感が交差する一曲…H1-KEY『君は夏だった』で“次世代ガールズグループ”の地位を確立
  • 「NATO加入放棄は“解決の礎”」ウクライナの譲歩にロシア歓迎、それでも決めるのはプーチンか
  • EXOファンミ当日に突然の不参加、急遽北京へ…中国人メンバーが謝罪「今後のアルバム活動には参加する」
  • 「悔しくて飲みすぎた」10年前の機内騒動に謝罪…ビジネスクラスが取れずワインをがぶ飲み?

おすすめニュース

  • 1
    飲酒事故で服役中の歌手キム・ホジュン、突然浮上した“舞台復帰説”に事務所が即否定

    エンタメ 

  • 2
    31公演で130万枚、興収1億8,570万ドル Stray Kidsが打ち立てた記録…11会場でK-POPアーティスト初公演

    エンタメ 

  • 3
    親交説を否定したリーダー、10年以上の関係を示唆されたメンバーは無言…「注射おばさん」波紋の行方

    エンタメ 

  • 4
    「週13本をこなした全盛期の裏側で…」忙しさが生んだ後輩との距離感、悔いの残るエピソードを告白

    エンタメ 

  • 5
    資産10億から一夜で転落…転倒事故をきっかけに人生が一変した71歳のベテラン歌手、波乱万丈な人生を告白

    エンタメ 

話題

  • 1
    EXO、冬の定番を継ぐ新曲「I'm Home」を電撃予告…「The First Snow」の感動再び?

    エンタメ 

  • 2
    「スキンケアのため訪問しただけ」SHINeeリーダー、“注射おばさん”との親交説疑惑に釈明

    エンタメ 

  • 3
    「まだAIだと思ってる?」人気俳優イ・イギョンの暴露者が新たな投稿、DM動画公開で波紋拡大

    エンタメ 

  • 4
    純白ドレスが話題に…大人気バンドQWER・チョダン、受賞の感動と母の誕生日を重ねた近況ショット公開

    エンタメ 

  • 5
    44歳で第2子に挑戦…流産・移植を経たタレントが語るリアル妊娠事情 豊胸手術も考えた?

    エンタメ 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]