メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

ディープシーク、長文処理の計算コストを大幅削減・推論速度を11.6倍向上…次世代AIモデルの鍵を握る「NSA」発表

佐藤美穂 アクセス  

高効率生成型人工知能(AI)モデルで世界的な旋風を巻き起こしたディープシークが長文を迅速に訓練し、推論できる最新技術を公開した。

19日、ディープシークのX公式アカウントによると、創業者の梁元峰氏を含むディープシークの開発チームは「NSA(Native Sparse Attention)」と名付けた新たなアテンションメカニズムを紹介する論文を、論文共有サイト「arXiv」に公開した。

ディープシークは論文の中で「長文(long-context)モデリングは次世代言語モデルにおいて極めて重要だが、標準的なアテンション(Attention)メカニズムの高い計算コストが大きな課題となっている」とし、「『スパース(sparse)アテンション』を活用することで、モデルの性能を維持しながら計算効率を改善できる」と述べた。

従来の「フル(Full)アテンション」メカニズムは、全てのトークン(AIモデルで処理されるデータ単位)間の関係を計算するシーケンス(文章の長さ)が増えるほど、計算負荷が指数関数的に増大するという問題があった。そのため、AI業界では一部のトークンのみを選択して計算する「スパースアテンション」の研究が活発に行われている。

ディープシークは「効率的な長文モデリングのためにアルゴリズム革新とハードウェア最適化を組み合わせた『生来的に訓練可能なスパースアテンション(NSA)』メカニズムを発表する」とし、「NSAは動的階層化(dynamic hierarchical)スパース戦略を採用し、トークンの圧縮と選択を組み合わせた」と説明した。

近年、AIモデルはChatGPTを開発したOpenAIの「o」シリーズやディープシークの「R1」、Googleの「Gemini 2.0」など、推論(reasoning)モデルが主流となり、長文処理能力がより一層求められている。

ディープシークが開発したNSAは、重要でないトークンを圧縮し、必須のトークンのみを選択して計算コストを削減し、処理速度を向上させる「動的階層化」スパース戦略を適用した。

ディープシークはフルアテンションとNSAのベンチマーク(性能比較)テストでは、NSAのスコアが高く、64Kシーケンス処理速度を比較した結果、デコーディングはNSAが11.6倍速く、逆伝播(backpropagation)も6倍速かったと主張した。

佐藤美穂
CP-2023-0299@fastviewkorea.com

コメント0

300

コメント0

[IT・テック] ランキング

  • 「独占企業の横暴か」...YouTubeをAI学習に“無断使用”!?EU、グーグルに最大売上10%の制裁も
  • 「ついに隠されたFace ID!」iPhone 18 Pro、ディスプレイ下に“全センサー集結”か
  • 「ホワイトカラー崩壊!」AIで職を失った元エンジニア、ブルーカラーで見つけた“最強の安定職”とは?
  • 「宇宙でも星が見えない!?」増えすぎた衛星が“小惑星検知”を邪魔する可能性も
  • 「AIが戦争を変える」米軍がGeminiを全軍投入、デジタル戦場の主導権を奪いに動く
  • 「宇宙船じゃないのか?」 火星軌道から撮られた“謎の核”の正体

こんな記事も読まれています

  • トヨタV8の最終進化か…2000GTとLFAが震えた新型GR GTの“禁断ハイブリッド”
  • ほぼ全ドライバーが知らない“長押しだけで生還できる”非常操作
  • 「日本の最後の砦が揺れた」中国がガソリン車まで奪取へ…2025年は逆転元年か
  • 「脱出“ゼロ秒”の罠」電動ドアが沈黙、炎上モデル3が示したEV最大の死角
  • 「日本をナメてるのか!?」中国戦闘機の“異常レーダー照射”に日本政府が断固抗議!
  • 「トランプ大統領、史上最大級タンカーを拿捕」…空母投入で高まる“ベネズエラ衝突”の現実味
  • 「FRB内部が真っ二つに割れた」…0.25%利下げの裏で進む物価高と雇用悪化の‟危険な衝突”
  • 「ロシア同盟国の狡猾作戦!」ベラルーシの気球が“領空侵害”、リトアニアは“国家非常事態”宣言

こんな記事も読まれています

  • トヨタV8の最終進化か…2000GTとLFAが震えた新型GR GTの“禁断ハイブリッド”
  • ほぼ全ドライバーが知らない“長押しだけで生還できる”非常操作
  • 「日本の最後の砦が揺れた」中国がガソリン車まで奪取へ…2025年は逆転元年か
  • 「脱出“ゼロ秒”の罠」電動ドアが沈黙、炎上モデル3が示したEV最大の死角
  • 「日本をナメてるのか!?」中国戦闘機の“異常レーダー照射”に日本政府が断固抗議!
  • 「トランプ大統領、史上最大級タンカーを拿捕」…空母投入で高まる“ベネズエラ衝突”の現実味
  • 「FRB内部が真っ二つに割れた」…0.25%利下げの裏で進む物価高と雇用悪化の‟危険な衝突”
  • 「ロシア同盟国の狡猾作戦!」ベラルーシの気球が“領空侵害”、リトアニアは“国家非常事態”宣言

おすすめニュース

  • 1
    「もう寒くないよ」母に捨てられた子猫たちを一晩中抱き締めて守った野良犬に世界が感動!

    フォトニュース 

  • 2
    この男、真冬でも半袖で過ごす…愛犬たちが形成した“暖房ネットワーク”の圧倒的威力にSNSが沸騰!

    フォトニュース 

  • 3
    中国人×中国人=金髪碧眼!? その理由はまさか…?

    トレンド 

  • 4
    元妻がしてくれた“あの助け”が恋しい…離婚男性が再婚の必要性を痛感する瞬間とは

    トレンド 

  • 5
    「宇宙船なのか!」太陽系を横切る“正体不明の訪問者”についてNASAがついに回答

    トレンド 

話題

  • 1
    「えっ、学食がまずいって?」娘の一言で…父親が仕事を辞めて屋台を始めた感動エピソード

    トレンド 

  • 2
    サンタ姿で“毒飴”を配ろうとした男、標的はユダヤ人児童だった

    トレンド 

  • 3
    「母を殺させて王座奪取」寄生アリの“完璧なクーデター” 九大研究が暴いた支配の真相

    トレンド 

  • 4
    「口が閉じたまま」排水剤誤飲の18ヶ月児 唇癒着の衝撃症状

    トレンド 

  • 5
    「食べた瞬間から異変」独家族3人死亡 トルコ名物フードに“致死疑惑”、警察が4人拘束

    トレンド 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]