
中国AI企業に「技術盗用」の疑い 禁輸対象のエヌビディア最先端チップを使用か
「低コスト・高性能モデル」で世界に衝撃を与えたDeepSeek(ディープシーク)など中国のAI企業が、米国による輸出禁止対象であるエヌビディアの最先端チップを使用し、OpenAIやアンソロピックのAIモデルを「蒸留」して自社モデルを訓練したとの疑惑が浮上している。他社モデルを蒸留してAIモデルを訓練することは、事実上の「技術盗用」とみなされる行為だ。
ロイター通信は23日(現地時間)、米政権高官の話として、近く発売予定のDeepSeekの最新AIモデルが、エヌビディアの最新チップ「Blackwell(ブラックウェル)」で訓練されたと報じた。同高官は、Blackwellの設置場所は中国内モンゴル自治区のデータセンターである可能性が高いとの見方を示した。また、DeepSeekがBlackwellを利用してOpenAIやアンソロピック、グーグル、xAIなど米国製AIモデルを「蒸留」したとの疑いが持たれている。
米国が輸出制限するBlackwell、中国国内のデータセンターで確認
Blackwellは高性能AIチップであり、使用可能な国は厳格に制限されている。米商務省は高性能AIチップの輸出を3段階(ティア1・2・3)で管理しており、カナダや欧州連合(EU)、英国、日本、韓国、豪州などの主要同盟国は、輸出許可の手続きが簡素化されている。第2段階(ティア2)には中東、東欧、東南アジア、中南米などが含まれ、ここでは高性能AIチップの国別・ユーザー別にGPU総量の上限が設定されており、輸出時には個別の許可を要する。
一方、中国はロシア、イラン、北朝鮮、シリア、ベネズエラなど20カ国の安全保障リスク国とともに第3段階(ティア3)に分類されている。ティア3は事実上の禁輸国だ。BlackwellだけでなくH100やH200なども持ち込めない国々だが、H200チップは例外的に対中輸出承認を受けたものの、諸規制により実際の出荷は遅れている。
輸出が禁止されているBlackwellがいかにして内モンゴル自治区のデータセンターへ流入したのか。その手法は多岐にわたる。まず、第三国を経由するルートだ。マレーシアやベトナム、台湾など輸出が許可された国の企業やデータセンターがBlackwellシステムを正規輸入した後、一部を中国企業に転売する手法がある。
また、名義貸しによる持ち込みも指摘されている。中国側のブローカーが海外にペーパーカンパニーを設立したり、現地企業の名義を借りてサーバーを購入し、中国国内へ納入する形態だ。Blackwell搭載サーバーやラック形式の製品を持ち込んだ後、第三国で分解して禁輸措置のない一般サーバーに偽装し、中国へ再輸出する方法も取り沙汰されている。
エヌビディアは否定も、短期間での配送を保証する実態
第三国経由などの手法で中国にBlackwellが持ち込まれているという疑惑は、すでに公然の事実となっていた。米紙ウォール・ストリート・ジャーナルは昨年3月、中国・深圳のリセラー(転売業者)が上海の顧客からBlackwellサーバーの注文を受け、マレーシアやベトナムなどのデータセンター運営会社やエヌビディアの公式顧客から製品を入手し、中国の顧客に引き渡す過程を報じた。このリセラーは海外登録法人を活用し、自社使用目的でサーバーを購入した後、一部を中国側に再販売していた。再販売のシステムも確立されており、リセラーがエスクロー口座で前払いを受け「6週間以内の配送」を約束する状況にまでなっていたという。
米IT専門メディア「ジ・インフォメーション」も昨年12月、DeepSeekなどが東南アジアを含む迂回ルートを通じて、エヌビディア製チップを中国へ密かに持ち込んでいると報じた。東南アジアのデータセンターにチップを設置した後、エヌビディアによる検査直後に分解し、虚偽申告を経て中国へ密輸するという手法だ。
当時、エヌビディア側は「そのような密輸はあり得ない」と述べ、「受け取る全ての情報を追跡している」と否定した。同社は「迂回・転用が疑われる案件を全て調査している」とし、中国への流入は不可能だと主張するが、最終利用者(エンドユーザー)の特定は困難だ。米国やエヌビディアが管理可能な段階は、米国から最初の輸入国までに限られるのが実情といえる。
モデル訓練でも「技術盗用」の疑い
中国AI企業は、モデルの訓練過程においても「蒸留」を通じて事実上の技術盗用を行った疑いが持たれている。蒸留とは、上位AIモデルの回答をデータとして活用し、新しいモデルを訓練する技法を指す。
DeepSeekは、自社モデルの訓練ツールとして蒸留を使用したことを公表している。推論モデル「DeepSeek-R1」を大規模計算や強化学習(RL)などで構築し、このモデルを「教師(teacher)」として、他のモデルに推論過程を学習させたという。R1が生成した高品質な回答サンプル約80万件を蒸留用データとして使用し、小規模なオープンソースモデルを「学生」としてR1の出力を模倣させる形で訓練したとしている。
自社モデル内での蒸留はコスト削減に有効な技法だが、問題は他社モデルを大規模に無断蒸留して性能向上に利用したという疑惑だ。業界ではこれを事実上の技術盗用とみなしている。
性能特性や回答スタイル、ベンチマークの類似性などを根拠に、DeepSeekの「R1」および基盤モデル「V3」が、OpenAIの「GPT-4」や「GPT-4o」を大量に呼び出し、無断で蒸留したとの疑いが持たれている。一部では、アンソロピックの「Claude(クロード)」系列も併用された可能性が指摘されている。
実際にアンソロピックは23日(現地時間)、DeepSeekを含む中国企業3社がClaudeを不正に抽出した事実を確認したと主張した。偽アカウント約2万4,000件を通じて1,600万件以上の対話を生成し、モデルの成果物を抽出したという。中国企業による高性能チップの密輸と技術抽出の疑いが深まる中、米国では対中禁輸措置などの規制強化に関する議論がさらに加速する見通しだ。













コメント0