メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「90分で突破された」…AI安全装置の無力化に“非常事態”の恐怖

織田昌大 アクセス  

出典:ロイター通信
出典:ロイター通信

人工知能(AI)モデルのガードレールを取り除くソフトウェアがオンラインで拡散し、改変AIモデルが大量に流通していることが明らかになった。一部のモデルは生物兵器の製造や悪性コードの作成要求にも応じたことが確認され、AIの安全性への懸念が高まっている。

25日(現地時間)フィナンシャル・タイムズ(FT)は、AI安全性研究団体アリスが行った実験で、ガードレールが取り除かれたオープンソースAIモデルは危険な質問にも制限なく回答したと報じた。

研究チームはGitHubに公開された「Heretic」というツールを活用し、MetaのAIモデル「Llama 3.3」のガードレールを10分で取り除いた。別途専門機器も必要なかった。

問題は、ガードレールが取り除かれたモデルが既存のシステムではブロックされていた要求にも応じる点だ。例えば、GoogleのオープンソースモデルGemma 3の改変バージョンは、塩素ガスを密閉空間に拡散させる方法やクレジットカード情報を盗むコード生成要求などに回答した。児童性的虐待を描写する文章まで作成したとされる。

オープンソースAIが急速に高度化する中、開発者が設定したガードレールを維持することがますます難しくなっているとの指摘がある。シカゴ大学ブース・スクール・オブ・ビジネスの応用AI教授カウィン・エタヤラージ氏は「以前はガードレールを取り除くには高度な技術知識が必要だったが、今では一般ユーザーも簡単にアクセスできるようになった」と述べた。

Hereticの開発者フィリップ・エマニュエル・バイトマンはFTに「昨年公開以来、このツールを活用して3,500以上の検閲解除モデルが作成された」とし、「関連モデルのダウンロード数は1,300万件に達する」と明らかにした。彼はまた、Googleの最新モデルGemma 4も発売90分でガードレールが取り除かれたと付け加えた。

改変モデルが拡散する中、各国政府やAI企業が開発段階で安全規制を適用しようとする試みも一層複雑になっている。OpenAIは最近公開したGPT-OSSモデルで危険な情報を取り除いたデータセットで学習させる方式を導入している。

ただし、専門家は有害データを取り除いたからといってモデルが自動的に安全になるわけではないと指摘する。エタヤラージ教授は「危険な情報を過度に取り除くと、逆にモデルが悪用を認識できなくなる可能性がある」とし、「有害データを取り除いたからといってAIが自動的に善良なシステムになるわけではない」と述べた。

GitHubは「違法攻撃や悪性コード活動を直接支援するコンテンツは禁止している」としつつも、「セキュリティ研究と教育目的のソースコードは許可対象」と説明した。Metaは別途の見解を示していない。ただし、会社側の関係者は「災害的なレベルの危険があると判断されるモデルは、十分な対策が整うまで公開しない」と伝えた。

コメント0

300

コメント0

[IT・テック] ランキング

  • ブラック派がついに揺れるのか…iPhone18 Pro新色「ダークチェリー」に早くも本命説
  • 中国で世界初のロボット学校が開校…「ヒューマノイドも学校へ行く時代」に
  • 「AIバブルか、本物か」…孫正義がフランスに約13兆円を投じる“巨大計画”
  • AIデータセンターは本当に“電気を食う施設”なのか…米軍元中将が語った意外な役割
  • 「AIリストラ」は本当に避けられないのか…半導体王が経営者の“言い訳”を一刀両断
  • 「パスワードはもう危ない」…英情報トップが警告した中露スパイ戦の“次の標的”

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 「EUとの協力は重大な脅威だ!」アルメニアを追い詰めるプーチンの焦り
  • レアアース脱中国へ加速、代替磁石と新型モーター競争本格化
  • グーグル、“蚊3,200万匹の放出”を推進…一体何事!?
  • イランが米軍拠点攻撃主張、ホルムズ海峡巡り緊張再燃

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 「EUとの協力は重大な脅威だ!」アルメニアを追い詰めるプーチンの焦り
  • レアアース脱中国へ加速、代替磁石と新型モーター競争本格化
  • グーグル、“蚊3,200万匹の放出”を推進…一体何事!?
  • イランが米軍拠点攻撃主張、ホルムズ海峡巡り緊張再燃

おすすめニュース

  • 1
    「こんなタコは見たことがない」ガラパゴス深海1800mで発見…ゴルフボールサイズの“青い新種ミニタコ”

    トレンド 

  • 2
    「先に行くよ」の一言で彼女を山に置き去り…命の危険まで招く“登山破局男”の心理とは

    トレンド 

  • 3
    「頭頂部を高くすれば小顔で若く見える?」…頭皮を切開し穴まで開ける“頭の美容整形”に危険性の指摘も

    ヒント 

  • 4
    GMのAI革命「夜通し計算が1分に」…自動車開発の第3段階で業界の常識を覆す

    モビリティー 

  • 5
    宿泊客の「ドライヤー放置」に衝撃、ホテル火災寸前でSNS話題に

    トレンド 

話題

  • 1
    「月1万個の廃棄品を削減」日本自動車業界が不良品基準を大幅緩和、その背景とは

    モビリティー 

  • 2
    なぜ公衆トイレの便座はU字型なのか?

    トレンド 

  • 3
    「中国も真似しないデザイン」フェラーリ初EV論争にランボルギーニCEOが参戦

    モビリティー 

  • 4
    「ここは食堂ではない」空港の授乳室でカップ麺を食べる中国人観光客…SNS拡散で迷惑利用に波紋

    トレンド 

  • 5
    子どもへの初めての車選び、IIHSとコンシューマーレポートが推奨する安全モデルとは

    モビリティー 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]