メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

米OpenAI×Anthropic、AIモデルクロステストで危険性露呈!GPT系モデル、一部は「悪用に脆弱」

望月博樹 アクセス  

米OpenAIとAnthropic(アンソロピック)が自社の公開言語モデルを相互にテストした結果、利用過程で生じ得るセキュリティ上の脆弱性や悪用の可能性が浮き彫りになった。両社による今回の協力は、GPT-5のような次世代大規模言語モデル(LLM)を企業が導入する際、不可欠な評価要素を提示したという点で注目されている。

引用:depositphotos

両社はAIモデルの整合性(アラインメント)と責任性を検証することを目的に、クロスチェックを実施した。企業がAIモデルの潜在的リスクを事前に把握し、より安全な選択を行えるよう支援する狙いだ。OpenAIは「新しい脅威シナリオにモデルが適切に対応できるかを確認することに意義がある」と説明した。

テストの結果、OpenAIのGPT-4oやGPT-4.1、さらに小型モデルのo4-miniは、悪意ある質問に応じやすい傾向を示し、アンフェタミン製造法や生物化学兵器開発、テロ計画の具体的な説明を提供したケースも確認された。一方、AnthropicのClaude 4シリーズはより高い拒否率を示し、質問への応答を控えたり、偽情報の提供を避ける傾向が見られた。

検証には、両社が共通して「SHADE-Arena サボタージュ・フレームワーク」を活用した。実験環境は極端なシナリオを中心に設計され、OpenAIは「モデルが極限状況でどう反応するか」を分析したという。Anthropicも「現実的な発生確率ではなく、危険行為の潜在性そのものに焦点を当てた」と述べている。

今回のテストは単なる性能比較ではなく、モデルが本来の目的からどれほど逸脱するかを測定することに重点が置かれた。使用モデルは、GPT-4o、GPT-4.1、o3、o4-mini、そしてClaude 4 OpusとSonnetなど、公開APIを通じて提供される最新モデル群だった。

特にGPT系の一部モデルでは、「ユーザーに過度に従ったり迎合する反応」、いわゆる「おべっか(sycophancy)」の問題も指摘された。OpenAIはこれに対応するため、最近ChatGPTの関連アップデートを撤回し、今後は整合性の課題に一層注力するとしている。

企業にとって今回の結果は、AIモデル導入時の重要なチェックリストとなる可能性がある。単一モデルの検証にとどまらず、複数ベンダー間の性能・リスク比較、推論特化型と会話型モデルの分離評価、悪用可能性や拒否応答の有用性を含めたストレステストが必要だ。また、導入後も継続的な監査と追跡システムの構築が推奨される。

OpenAIとAnthropicは、テストに加えてそれぞれ独自の対策も講じている。OpenAIは「ルールベース報酬(Rules-Based Rewards)」システムを通じて整合性性能の強化を進めており、Anthropicも内部監視を担う「監査エージェント(Auditing Agents)」を導入し、モデルの安定性を点検している。

GPT-5の登場で市場の関心が一段と高まる中、企業は高性能AIの華やかな側面にとどまらず、その背後に潜む脆弱性を軽視しないことが求められる。今回のテスト結果は、その点を示す重要な警鐘となっている。AIモデルの性能と同等、あるいはそれ以上に、安全性の検証と責任性の確保が大きな課題となっている。

望月博樹
CP-2023-0364@fastviewkorea.com

コメント0

300

コメント0

[IT・テック] ランキング

  • 「テスラ、欧州で大コケ!」7か月連続不振で7月販売40%減...一方BYDは225%急増、シェア急拡大!
  • 「天才集結のはずが」…Metaの“超知能研究所”、発足2カ月で最重要人材が相次ぎ退社!ザッカーバーグの大型計画に暗雲
  • 【バドミントン革命】シャトルを追跡して打ち返すロボット ETH研究チームがバドミントン制御に成功
  • 米国の「50%関税」も怖くない?スズキ、インドEV事業に「1兆円超」投資!その狙いは?
  • 【初成功】スペースXのスターシップ、爆発続きからついに8基の衛星投入に成功
  • スペースX、10回目の試験飛行で完全成功!「模擬衛星展開」も完璧クリアでNASA「アルテミス計画」に弾み

こんな記事も読まれています

  • 7.9トンの戦車が時速80kmで疾走! ジェイ・レノのLA公道ドライブ映像がSNSで拡散
  • メルセデス・マイバッハ「SL680」登場! V8ツインターボ搭載の究極ロードスターが世界市場で販売開始
  • フォルクスワーゲン「ID.ファミリー」累計150万台突破!欧州EV販売でテスラ超え、日本市場でも存在感拡大
  • スズキ新型「エブリイJ・リミテッド」登場! アウトドア仕様の軽バンが4WDターボで198万円切り
  • 【戦争の爪痕】民間空港が炎に沈んだ…写真が示す「戦争のビフォー&アフター」の衝撃
  • 「目も鼻も整形してない」多くの疑惑が浮上していた人気俳優、43歳でも変わらぬ美貌を維持
  • たまごっち、韓国で異常な熱狂!定価の10倍でも奪い合い…「子ども時代の記憶」が爆発的需要に火をつける
  • 「えっ?」二度見必至の衣装…“ウォーターバムの女神”クォン・ウンビ、大胆ファッション公開でファンも衝撃

こんな記事も読まれています

  • 7.9トンの戦車が時速80kmで疾走! ジェイ・レノのLA公道ドライブ映像がSNSで拡散
  • メルセデス・マイバッハ「SL680」登場! V8ツインターボ搭載の究極ロードスターが世界市場で販売開始
  • フォルクスワーゲン「ID.ファミリー」累計150万台突破!欧州EV販売でテスラ超え、日本市場でも存在感拡大
  • スズキ新型「エブリイJ・リミテッド」登場! アウトドア仕様の軽バンが4WDターボで198万円切り
  • 【戦争の爪痕】民間空港が炎に沈んだ…写真が示す「戦争のビフォー&アフター」の衝撃
  • 「目も鼻も整形してない」多くの疑惑が浮上していた人気俳優、43歳でも変わらぬ美貌を維持
  • たまごっち、韓国で異常な熱狂!定価の10倍でも奪い合い…「子ども時代の記憶」が爆発的需要に火をつける
  • 「えっ?」二度見必至の衣装…“ウォーターバムの女神”クォン・ウンビ、大胆ファッション公開でファンも衝撃

おすすめニュース

  • 1
    ビル・ゲイツ、韓国バラエティで明かした“私は最も運がいい人間”…29兆円寄付と子供に家業を継がせない理由

    エンタメ 

  • 2
    G-DRAGON、大韓航空ファーストクラス専用パジャマを空港ファッションに昇華…SNSで「格が違う」と大反響

    K-POP 

  • 3
    【医療革命】脳に光を当てるだけで飲酒欲求が減少 アルコール依存症治療に新たな可能性

    ライフスタイル 

  • 4
    【炎上】ディズニープラス新作『幻惑』、済州島での“ごみ放置映像”に批判殺到…主演スジ&キム・ソンホ公開前から危機

    エンタメ 

  • 5
    アーバンザカパ・チョ・ヒョナ、母の死後に支えた継父との絆…番組で語られた家族の真実に視聴者号泣

    エンタメ 

話題

  • 1
    【爆笑】EXOカイ&IVEウォニョン“同伴入隊”挑戦!軍事学科でまさかのトイレ談義まで勃発!?

    エンタメ 

  • 2
    マーゴット・ロビー、インタビュー中に赤ちゃんの泣き声で思わず反応 母としての素顔に注目集まる

    トレンド 

  • 3
    妻が落とした「愛の証」を求め、“腐臭漂う18トンのゴミ山”に飛び込んだ世紀のロマンチスト

    トレンド 

  • 4
    「ストレス解消のためやった」…中国で女性を麻酔で昏睡させ、“血を抜いた”狂気の男、わずか2年の実刑判決で批判殺到!

    トレンド 

  • 5
    【世界騒然】テイラー・スウィフト婚約発表で宝飾株が急騰!“テイラーノミクス”再び炸裂

    エンタメ