メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

米OpenAI×Anthropic、AIモデルクロステストで危険性露呈!GPT系モデル、一部は「悪用に脆弱」

望月博樹 アクセス  

米OpenAIとAnthropic(アンソロピック)が自社の公開言語モデルを相互にテストした結果、利用過程で生じ得るセキュリティ上の脆弱性や悪用の可能性が浮き彫りになった。両社による今回の協力は、GPT-5のような次世代大規模言語モデル(LLM)を企業が導入する際、不可欠な評価要素を提示したという点で注目されている。

引用:depositphotos

両社はAIモデルの整合性(アラインメント)と責任性を検証することを目的に、クロスチェックを実施した。企業がAIモデルの潜在的リスクを事前に把握し、より安全な選択を行えるよう支援する狙いだ。OpenAIは「新しい脅威シナリオにモデルが適切に対応できるかを確認することに意義がある」と説明した。

テストの結果、OpenAIのGPT-4oやGPT-4.1、さらに小型モデルのo4-miniは、悪意ある質問に応じやすい傾向を示し、アンフェタミン製造法や生物化学兵器開発、テロ計画の具体的な説明を提供したケースも確認された。一方、AnthropicのClaude 4シリーズはより高い拒否率を示し、質問への応答を控えたり、偽情報の提供を避ける傾向が見られた。

検証には、両社が共通して「SHADE-Arena サボタージュ・フレームワーク」を活用した。実験環境は極端なシナリオを中心に設計され、OpenAIは「モデルが極限状況でどう反応するか」を分析したという。Anthropicも「現実的な発生確率ではなく、危険行為の潜在性そのものに焦点を当てた」と述べている。

今回のテストは単なる性能比較ではなく、モデルが本来の目的からどれほど逸脱するかを測定することに重点が置かれた。使用モデルは、GPT-4o、GPT-4.1、o3、o4-mini、そしてClaude 4 OpusとSonnetなど、公開APIを通じて提供される最新モデル群だった。

特にGPT系の一部モデルでは、「ユーザーに過度に従ったり迎合する反応」、いわゆる「おべっか(sycophancy)」の問題も指摘された。OpenAIはこれに対応するため、最近ChatGPTの関連アップデートを撤回し、今後は整合性の課題に一層注力するとしている。

企業にとって今回の結果は、AIモデル導入時の重要なチェックリストとなる可能性がある。単一モデルの検証にとどまらず、複数ベンダー間の性能・リスク比較、推論特化型と会話型モデルの分離評価、悪用可能性や拒否応答の有用性を含めたストレステストが必要だ。また、導入後も継続的な監査と追跡システムの構築が推奨される。

OpenAIとAnthropicは、テストに加えてそれぞれ独自の対策も講じている。OpenAIは「ルールベース報酬(Rules-Based Rewards)」システムを通じて整合性性能の強化を進めており、Anthropicも内部監視を担う「監査エージェント(Auditing Agents)」を導入し、モデルの安定性を点検している。

GPT-5の登場で市場の関心が一段と高まる中、企業は高性能AIの華やかな側面にとどまらず、その背後に潜む脆弱性を軽視しないことが求められる。今回のテスト結果は、その点を示す重要な警鐘となっている。AIモデルの性能と同等、あるいはそれ以上に、安全性の検証と責任性の確保が大きな課題となっている。

望月博樹
CP-2023-0364@fastviewkorea.com

コメント0

300

コメント0

[IT・テック] ランキング

  • 【エロ解禁】ChatGPTに“成人向け機能”登場!AIと“大人の会話”楽しめるバージョン、12月リリースへ
  • Neura Roboticsが送り出す「4NE1」…人と共に学び、感じ、考える次世代ヒューマノイド
  • 【米軍の新兵器】AIが操縦する無人ヘリ「U-ホーク」登場!ブラックホークが“戦場の亡霊”に進化
  • アップル、iOS26.1第3ベータを電撃公開…“ChatGPT依存”からの脱却へ、他社AIも続々参入
  • 「Apple AirPods、次のステージへ!」体温測定&カメラ搭載で“アクセサリーを超える存在”に
  • 「逆襲のマスク」連続爆発からの完全復活…スターシップが示した“宇宙覇権”への道

こんな記事も読まれています

  • フォード「ブロンコEV」登場…BYD電池搭載、キャンピング仕様で中国市場に挑む
  • 【人気爆発】4年待ちの「ランドクルーザー」、値上げしても完売続出…“売れるから強気”
  • フェラーリでもポルシェでもない…伝説俳優マックイーンが最後まで愛した「ハドソン・ワスプ」が競売へ
  • 【スバル覚醒】「インプレッサ魂」がEVで蘇る!独自開発の高性能ヘイローモデル計画始動
  • 【小さな番人】毎晩、眠れぬ飼い主をそばで見守り続けるポメラニアンの愛情に胸キュン
  • 無邪気すぎる「白菜泥棒」!白菜に潜む子犬の姿に世界中がほっこり
  • 「死ぬかと思った」…深夜の首都高速で時速180km!2車線またぐ危険走行に目撃ドライバー悲鳴
  • 「焼失した故郷を元に戻す!」20億ドルの宝くじ当選者、“故郷復活プロジェクト”へ巨額投資

こんな記事も読まれています

  • フォード「ブロンコEV」登場…BYD電池搭載、キャンピング仕様で中国市場に挑む
  • 【人気爆発】4年待ちの「ランドクルーザー」、値上げしても完売続出…“売れるから強気”
  • フェラーリでもポルシェでもない…伝説俳優マックイーンが最後まで愛した「ハドソン・ワスプ」が競売へ
  • 【スバル覚醒】「インプレッサ魂」がEVで蘇る!独自開発の高性能ヘイローモデル計画始動
  • 【小さな番人】毎晩、眠れぬ飼い主をそばで見守り続けるポメラニアンの愛情に胸キュン
  • 無邪気すぎる「白菜泥棒」!白菜に潜む子犬の姿に世界中がほっこり
  • 「死ぬかと思った」…深夜の首都高速で時速180km!2車線またぐ危険走行に目撃ドライバー悲鳴
  • 「焼失した故郷を元に戻す!」20億ドルの宝くじ当選者、“故郷復活プロジェクト”へ巨額投資

おすすめニュース

  • 1
    73000キロの地球一周ミッションへ!米国の深海探査ロボット、“気象予測精度向上”を目指し5年間の航海開始

    トレンド 

  • 2
    東名高速で「ビタ付け団子走行」が暴走劇に…追い越し直後に衝突、運転手の“異様な冷静さ”が話題に

    フォトニュース 

  • 3
    「もう限界を超えた」世界のサンゴ礁が崩壊寸前…23か国・160人の科学者が緊急警告

    トレンド 

  • 4
    【衝撃告白】カン・ジュウン、“ミスコリア合宿から脱走”…夜中に仲間とカラオケへ!?

    エンタメ 

  • 5
    「寝落ちしたら誰もいなかった」…カン・ハヌル、『ラジオスター』で語った“想像超えの裏話”

    エンタメ 

話題

  • 1
    「人生最大の後悔」…アル・パチーノ、ダイアン・キートンとの“叶わなかった愛”に涙

    エンタメ 

  • 2
    16年隠していた不倫が発覚!父親の葬儀で「もう一人の妻」が現れ、中国の男に懲役1年

    トレンド 

  • 3
    「白い部屋の彫刻家」…ド・ギョンス、『彫刻都市』で“純粋悪”の魅力を解き放つ

    エンタメ 

  • 4
    「ダニエル監督の失踪」…BOYNEXTDOOR、『The Action』トレーラーで“映画級カムバック”

    K-POP 

  • 5
    JISOO、“8曲で10億ストリーミング突破”…『EYES CLOSED』で世界を染めた

    K-POP