メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

米OpenAI×Anthropic、AIモデルクロステストで危険性露呈!GPT系モデル、一部は「悪用に脆弱」

望月博樹 アクセス  

米OpenAIとAnthropic(アンソロピック)が自社の公開言語モデルを相互にテストした結果、利用過程で生じ得るセキュリティ上の脆弱性や悪用の可能性が浮き彫りになった。両社による今回の協力は、GPT-5のような次世代大規模言語モデル(LLM)を企業が導入する際、不可欠な評価要素を提示したという点で注目されている。

引用:depositphotos

両社はAIモデルの整合性(アラインメント)と責任性を検証することを目的に、クロスチェックを実施した。企業がAIモデルの潜在的リスクを事前に把握し、より安全な選択を行えるよう支援する狙いだ。OpenAIは「新しい脅威シナリオにモデルが適切に対応できるかを確認することに意義がある」と説明した。

テストの結果、OpenAIのGPT-4oやGPT-4.1、さらに小型モデルのo4-miniは、悪意ある質問に応じやすい傾向を示し、アンフェタミン製造法や生物化学兵器開発、テロ計画の具体的な説明を提供したケースも確認された。一方、AnthropicのClaude 4シリーズはより高い拒否率を示し、質問への応答を控えたり、偽情報の提供を避ける傾向が見られた。

検証には、両社が共通して「SHADE-Arena サボタージュ・フレームワーク」を活用した。実験環境は極端なシナリオを中心に設計され、OpenAIは「モデルが極限状況でどう反応するか」を分析したという。Anthropicも「現実的な発生確率ではなく、危険行為の潜在性そのものに焦点を当てた」と述べている。

今回のテストは単なる性能比較ではなく、モデルが本来の目的からどれほど逸脱するかを測定することに重点が置かれた。使用モデルは、GPT-4o、GPT-4.1、o3、o4-mini、そしてClaude 4 OpusとSonnetなど、公開APIを通じて提供される最新モデル群だった。

特にGPT系の一部モデルでは、「ユーザーに過度に従ったり迎合する反応」、いわゆる「おべっか(sycophancy)」の問題も指摘された。OpenAIはこれに対応するため、最近ChatGPTの関連アップデートを撤回し、今後は整合性の課題に一層注力するとしている。

企業にとって今回の結果は、AIモデル導入時の重要なチェックリストとなる可能性がある。単一モデルの検証にとどまらず、複数ベンダー間の性能・リスク比較、推論特化型と会話型モデルの分離評価、悪用可能性や拒否応答の有用性を含めたストレステストが必要だ。また、導入後も継続的な監査と追跡システムの構築が推奨される。

OpenAIとAnthropicは、テストに加えてそれぞれ独自の対策も講じている。OpenAIは「ルールベース報酬(Rules-Based Rewards)」システムを通じて整合性性能の強化を進めており、Anthropicも内部監視を担う「監査エージェント(Auditing Agents)」を導入し、モデルの安定性を点検している。

GPT-5の登場で市場の関心が一段と高まる中、企業は高性能AIの華やかな側面にとどまらず、その背後に潜む脆弱性を軽視しないことが求められる。今回のテスト結果は、その点を示す重要な警鐘となっている。AIモデルの性能と同等、あるいはそれ以上に、安全性の検証と責任性の確保が大きな課題となっている。

望月博樹
CP-2023-0364@fastviewkorea.com

コメント0

300

コメント0

[IT・テック] ランキング

  • 「人間の頭蓋骨も砕ける」...NVIDIA出資のFigure AI、元安全責任者の“衝撃告発”で信用崩壊へ!
  • 「軽さは正義、だが万能ではない」iPhone Air購入前に知るべき落とし穴
  • 「寝ているだけでシャワー完了」…“人間洗濯機”1台のお値段は?
  • 「無人艦は停止、ドローンは墜落」...高評価AI企業の兵器、“技術的な欠陥”が続出!
  • 「少年自殺も、責任は取らず?」OpenAI、“少年自殺訴訟”で責任を完全否認!
  • 「宇宙で“置き去り”」神舟20号が衝突損傷、3人救出へ中国が異例の緊急発射

こんな記事も読まれています

  • BMW、中国AIへ“全面転換”!?iX3が独自L2++採用、中国版だけ異例仕様
  • 「不要と言われた変速機、なぜEVに戻った?」ポルシェが示した“真の狙い”
  • テスラで止まらぬ“CarPlay渇望”、オーナー21%が次の車に強く要求する理由
  • 「美観破壊の元凶」前面ナンバー義務に反発、スーパーカー界で“規制論争”再燃
  • 体の“特徴”は男性なのに女性エリアへ? 韓国式サウナ判決で全米が揺れる
  • 33時間トイレ禁止…中国“寝そべり祭り”が地獄のサバイバル化
  • 「もうウナギは食べられないのか?」 絶滅危惧種指定の可能性、EU規制は最終局面へ
  • AIが“食べられる”と断言、70代男性が中毒…その後わかった事実とは

こんな記事も読まれています

  • BMW、中国AIへ“全面転換”!?iX3が独自L2++採用、中国版だけ異例仕様
  • 「不要と言われた変速機、なぜEVに戻った?」ポルシェが示した“真の狙い”
  • テスラで止まらぬ“CarPlay渇望”、オーナー21%が次の車に強く要求する理由
  • 「美観破壊の元凶」前面ナンバー義務に反発、スーパーカー界で“規制論争”再燃
  • 体の“特徴”は男性なのに女性エリアへ? 韓国式サウナ判決で全米が揺れる
  • 33時間トイレ禁止…中国“寝そべり祭り”が地獄のサバイバル化
  • 「もうウナギは食べられないのか?」 絶滅危惧種指定の可能性、EU規制は最終局面へ
  • AIが“食べられる”と断言、70代男性が中毒…その後わかった事実とは

おすすめニュース

  • 1
    海外通販の死角、13歳の腸を貫通した“超強力磁石” 医師が語る最悪の瞬間

    気になる 

  • 2
    「私の荷物が海に流れた!」フェリー乗務員の“ミス”で荷物が一斉流出…補償めぐり激論に

    トレンド 

  • 3
    「妹だから大目に見るワン」...犬なのにここまで寛大!?柴犬と女の子の友情に心がほっこり

    フォトニュース 

  • 4
    「16人でピザ5枚だと?消えろ!」イタリア店主、台湾客をSNSで侮辱し謝罪騒動に

    トレンド 

  • 5
    「脂質やDNA材料まで確認!」土星衛星で“生まれたて有機物”発見!生命の手がかり濃厚

    トレンド 

話題

  • 1
    「絶対に近づくな」ウイルス複数の可能性、脱走サル1匹が依然行方不明

    気になる 

  • 2
    驚異の10cmオープン…見る人を凍らせる“世界一の口”

    おもしろ 

  • 3
    60歳から“人間関係が壊れる三つの理由”、見た目より態度が暴く現実

    健康 

  • 4
    冬完全装備ワンちゃん、バーさんの愛情フルセットで寒波にも無敵

    おもしろ 

  • 5
    カフェイン控えろは古い?コーヒー常飲者ほど痛風発症が少なかった

    健康