メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「90分で突破された」…AI安全装置の無力化に“非常事態”の恐怖

織田昌大 アクセス  

出典:ロイター通信
出典:ロイター通信

人工知能(AI)モデルのガードレールを取り除くソフトウェアがオンラインで拡散し、改変AIモデルが大量に流通していることが明らかになった。一部のモデルは生物兵器の製造や悪性コードの作成要求にも応じたことが確認され、AIの安全性への懸念が高まっている。

25日(現地時間)フィナンシャル・タイムズ(FT)は、AI安全性研究団体アリスが行った実験で、ガードレールが取り除かれたオープンソースAIモデルは危険な質問にも制限なく回答したと報じた。

研究チームはGitHubに公開された「Heretic」というツールを活用し、MetaのAIモデル「Llama 3.3」のガードレールを10分で取り除いた。別途専門機器も必要なかった。

問題は、ガードレールが取り除かれたモデルが既存のシステムではブロックされていた要求にも応じる点だ。例えば、GoogleのオープンソースモデルGemma 3の改変バージョンは、塩素ガスを密閉空間に拡散させる方法やクレジットカード情報を盗むコード生成要求などに回答した。児童性的虐待を描写する文章まで作成したとされる。

オープンソースAIが急速に高度化する中、開発者が設定したガードレールを維持することがますます難しくなっているとの指摘がある。シカゴ大学ブース・スクール・オブ・ビジネスの応用AI教授カウィン・エタヤラージ氏は「以前はガードレールを取り除くには高度な技術知識が必要だったが、今では一般ユーザーも簡単にアクセスできるようになった」と述べた。

Hereticの開発者フィリップ・エマニュエル・バイトマンはFTに「昨年公開以来、このツールを活用して3,500以上の検閲解除モデルが作成された」とし、「関連モデルのダウンロード数は1,300万件に達する」と明らかにした。彼はまた、Googleの最新モデルGemma 4も発売90分でガードレールが取り除かれたと付け加えた。

改変モデルが拡散する中、各国政府やAI企業が開発段階で安全規制を適用しようとする試みも一層複雑になっている。OpenAIは最近公開したGPT-OSSモデルで危険な情報を取り除いたデータセットで学習させる方式を導入している。

ただし、専門家は有害データを取り除いたからといってモデルが自動的に安全になるわけではないと指摘する。エタヤラージ教授は「危険な情報を過度に取り除くと、逆にモデルが悪用を認識できなくなる可能性がある」とし、「有害データを取り除いたからといってAIが自動的に善良なシステムになるわけではない」と述べた。

GitHubは「違法攻撃や悪性コード活動を直接支援するコンテンツは禁止している」としつつも、「セキュリティ研究と教育目的のソースコードは許可対象」と説明した。Metaは別途の見解を示していない。ただし、会社側の関係者は「災害的なレベルの危険があると判断されるモデルは、十分な対策が整うまで公開しない」と伝えた。

織田昌大
//= the_author_meta('email'); ?>editor@kangnamtimes.com

コメント0

300

コメント0

[IT・テック] ランキング

  • ブラック派がついに揺れるのか…iPhone18 Pro新色「ダークチェリー」に早くも本命説
  • 中国で世界初のロボット学校が開校…「ヒューマノイドも学校へ行く時代」に
  • 「AIバブルか、本物か」…孫正義がフランスに約13兆円を投じる“巨大計画”
  • AIデータセンターは本当に“電気を食う施設”なのか…米軍元中将が語った意外な役割
  • 「AIリストラ」は本当に避けられないのか…半導体王が経営者の“言い訳”を一刀両断
  • 「パスワードはもう危ない」…英情報トップが警告した中露スパイ戦の“次の標的”

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

おすすめニュース

  • 1
    173cm・55kgの女優がラーメン4袋を完食…“吐き出し”疑惑にノーカットで大食いに挑む

    エンタメ 

  • 2
    12年間で兄に1000万以上の金銭支援をするも、勝手に200万分の株を売られ“絶縁”悩み中の弟

    エンタメ 

  • 3
    「給料は増えないのに、食費だけ高くなる」…食品2万品目値上げへ、家計直撃の現実

    トレンド 

  • 4
    「会社員時代には見られない金額」フリーに転向して半年足らずで“局アナ時代の年収”超え?

    エンタメ 

  • 5
    「居心地悪すぎた」遅咲きの歌手、30年の芸能人生最大の後悔は“5歳のサバ読み”?

    エンタメ 

話題

  • 1
    学歴詐称疑惑で干されるも濡れ衣だった…空白期間と生活苦を支えたのは“妻の毅然とした態度”

    エンタメ 

  • 2
    「笑いを取りたくてやりすぎた」先輩への発言が炎上した芸人、大衆の厳しい視線に心境を吐露

    エンタメ 

  • 3
    美人すぎて証明写真が悪用されまくった女優? 潔白証明のため裁判所に直接出向いた深刻被害

    エンタメ 

  • 4
    婚約者の妹を愛してしまう“禁断ロマンス”…芸人出身監督が手掛けたショートドラマに注目

    エンタメ 

  • 5
    “世紀のウェディング” デュア・リパが俳優カラム・ターナーと結婚、ロンドンの由緒あるホールで挙式

    エンタメ