メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「AIが自身の思考に騙される」、GPTやClaudeなど主要モデルが自ら安全機構を無効化、脆弱性を露呈

望月博樹 アクセス  

引用:記事の内容と関連しAIツールで作成されたイメージ/Gemini
引用:記事の内容と関連しAIツールで作成されたイメージ/Gemini

推論能力を備えた最新の人工知能(AI)モデルほど、ハッキング攻撃に対して脆弱であることが、最近の研究で判明した。従来の「より賢いAIほど安全」という仮定は覆された形になっている。

米AI企業『アンソロピック』(Anthropic)とオックスフォード大学、スタンフォード大学の共同研究チームは、最近『アーカイブ(arXiv)』に発表した論文で、AIの思考過程を逆手に取る「思考の連鎖ハイジャック」と呼ばれる手法を用いれば、主要商用モデルの安全装置を無効化できると明かした。米紙『フォーチュン』によれば、実験では一部のモデルで攻撃成功率が80%を超えたとしている。

この攻撃手法は、AIが問いに答える際に段階的に「考える」推論過程を狙うものである。攻撃者は無害に見える多数の思考段階の間に、有害な命令を巧妙に紛れ込ませる。AIは長い思考の連鎖の前半にのみ注意を向け、後半に挿入された危険な指示を認識できないため、結果として自らの安全装置が無効化される現象が発生するという。

研究チームは「推論段階が長くなるほど、攻撃成功率が急激に上昇した」と指摘した。簡単な思考過程では成功率が27%だったのに対し、一般的な推論の長さでは51%にまで上昇し、さらに思考段階を延ばすと80%以上にまで達したという。

この脆弱性は、『OpenAI』のGPT、『Anthropic』のClaude、『Google』のGemini、Grokなど主要AIモデル全般で確認された。特に、安全性を強化した「アライメントチューニング」モデルであっても、内部推論段階が操作されると防御に失敗することが判明した。

最近、AI業界ではモデルの性能限界を克服するため、単純なデータ学習にとどまらず「推論能力の拡張」に注力してきた。大量の演算時間を投入し、問いに対してより深く分析できるよう設計された「高度推論型モデル」がその代表例となっている。

しかし、今回の研究は、この高度化が逆にセキュリティ上の脆弱性を拡大させる可能性があることを示している。

研究を主導したオックスフォード大学AI安全センターは、「推論過程が長くなるほど、モデルの安全信号が弱まる」と指摘し、「AIが自ら危険を認識して遮断するメカニズムは依然として不安定であることを示している」と説明している。

研究チームは、対応策として「推論認識型防御」システムを提案している。

このシステムでは、AIが問題を段階的に考える過程で各段階の安全信号をリアルタイムに監視し、危険な指示が含まれた場合には自動的に警告を出すか、処理を中断する仕組みとなっている。初期実験では、既存モデルの性能を維持しつつ安全性を回復できることも確認されたという。

AIに対する「思考の連鎖ハイジャック」攻撃は、単なるコンテンツ生成のリスクにとどまらず、兵器製造指針や機密情報の漏洩といった実害につながる可能性がある。研究チームは「AIの推論能力が人間のように複雑になるほど、その内部思考の流れを悪用しようとする試みも高度化している」と指摘し、「AIの思考そのものを理解し制御する新たなセキュリティパラダイムが必要とされる」と強調した。

望月博樹
editor@kangnamtimes.com

コメント0

300

コメント0

[IT・テック] ランキング

  • 「天下のアップルもここまでか」”折りたたみiPhone”に大苦戦、発売にこぎ着けるのか?
  • 「こんなもん楽だぜー」押されても壊れない、ディズニー研究が転倒AIを実機で証明
  • スマホが高くなるのに進化しない、メモリ高騰が生んだ最悪の選択
  • 「衝突寸前200m」スターリンクと中国衛星が急接近、低軌道は限界なのか
  • 「アップルの刷新計画が止まらない!」MacBook Pro、5年ぶりの大幅見直し ディスプレイなど軒並み変更か
  • 「ほぼ折り畳めるiPad?」脱・スマホ型!“横長”iPhoneFoldで動画視聴が激変か

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 「工具を片手に、宇宙でカンカン!」”日本発”宇宙労働ロボットがISS・月面で本格稼働へ
  • 「中国産旅客機、不安で使えない」…C919量産失敗、エンジンも認証も“米欧頼み”の現実
  • デビュー後初のファッションの大舞台へ✨iznaメンバーMAI&KOKO、TGCランウェイモデルに抜擢
  • 演技経験ほぼゼロからの快進撃…映画『世界の主人』主演女優ソ・スビンが新人賞4冠を達成

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 「工具を片手に、宇宙でカンカン!」”日本発”宇宙労働ロボットがISS・月面で本格稼働へ
  • 「中国産旅客機、不安で使えない」…C919量産失敗、エンジンも認証も“米欧頼み”の現実
  • デビュー後初のファッションの大舞台へ✨iznaメンバーMAI&KOKO、TGCランウェイモデルに抜擢
  • 演技経験ほぼゼロからの快進撃…映画『世界の主人』主演女優ソ・スビンが新人賞4冠を達成

おすすめニュース

  • 1
    「限界は決まっていない」Zカップの可能性も?英国で胸の異常肥大に悩む女性

    気になる 

  • 2
    「歩けないから送ってほしい?」韓国で運動後に119通報、救急車は誰のためのものか

    気になる 

  • 3
    「72歳でこの仕上がり?」元糖尿病指導員の祖母がビキニ出場、生活習慣の差が露わに

    気になる 

  • 4
    「ここなら大丈夫だにゃ」真冬の駐車場で子猫が選んだ避難先

    フォトニュース 

  • 5
    「踏まれても吠えなかった」満員地下鉄で震えながら役目を守った盲導犬

    気になる 

話題

  • 1
    「ミニスカにブルカ姿で国会乱入!」極右女性議員の“挑発パフォーマンス”で議会は大混乱

    トレンド 

  • 2
    「極寒の朝、テープで封じられた箱と涙の手紙」震える命に”希望の手”が差し伸べられた

    フォトニュース 

  • 3
    「歩いていたら罰金5万円!?」英国で広がる“理不尽な過剰取り締まり”とは

    トレンド 

  • 4
    「台湾で麻薬4,000万円相当を押収」”体内密輸”したタイ人女2人を現行犯逮捕

    トレンド 

  • 5
    【危機一髪】ただ手に取っただけだった...観光客を死の危険にさらした”意外な”生き物とは?

    トレンド 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]