メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

ディープシーク、長文処理の計算コストを大幅削減・推論速度を11.6倍向上…次世代AIモデルの鍵を握る「NSA」発表

佐藤美穂 アクセス  

高効率生成型人工知能(AI)モデルで世界的な旋風を巻き起こしたディープシークが長文を迅速に訓練し、推論できる最新技術を公開した。

19日、ディープシークのX公式アカウントによると、創業者の梁元峰氏を含むディープシークの開発チームは「NSA(Native Sparse Attention)」と名付けた新たなアテンションメカニズムを紹介する論文を、論文共有サイト「arXiv」に公開した。

ディープシークは論文の中で「長文(long-context)モデリングは次世代言語モデルにおいて極めて重要だが、標準的なアテンション(Attention)メカニズムの高い計算コストが大きな課題となっている」とし、「『スパース(sparse)アテンション』を活用することで、モデルの性能を維持しながら計算効率を改善できる」と述べた。

従来の「フル(Full)アテンション」メカニズムは、全てのトークン(AIモデルで処理されるデータ単位)間の関係を計算するシーケンス(文章の長さ)が増えるほど、計算負荷が指数関数的に増大するという問題があった。そのため、AI業界では一部のトークンのみを選択して計算する「スパースアテンション」の研究が活発に行われている。

ディープシークは「効率的な長文モデリングのためにアルゴリズム革新とハードウェア最適化を組み合わせた『生来的に訓練可能なスパースアテンション(NSA)』メカニズムを発表する」とし、「NSAは動的階層化(dynamic hierarchical)スパース戦略を採用し、トークンの圧縮と選択を組み合わせた」と説明した。

近年、AIモデルはChatGPTを開発したOpenAIの「o」シリーズやディープシークの「R1」、Googleの「Gemini 2.0」など、推論(reasoning)モデルが主流となり、長文処理能力がより一層求められている。

ディープシークが開発したNSAは、重要でないトークンを圧縮し、必須のトークンのみを選択して計算コストを削減し、処理速度を向上させる「動的階層化」スパース戦略を適用した。

ディープシークはフルアテンションとNSAのベンチマーク(性能比較)テストでは、NSAのスコアが高く、64Kシーケンス処理速度を比較した結果、デコーディングはNSAが11.6倍速く、逆伝播(backpropagation)も6倍速かったと主張した。

佐藤美穂
editor@kangnamtimes.com

コメント0

300

コメント0

[IT・テック] ランキング

  • 宇宙が次のAI工場に、マスクとビッグテックが描く新インフラ競争
  • 「救命チューブはいらぬ」溺水者のもとへ飛び込むドローン登場…成人1人がつかまっても“余裕”
  • 「薄さとデザイン最優先!」“iPhone Fold”最終形が流出 “デザインのアップル”、名誉回復なるか?
  • 何でも作れるはずのAIの嘘、なぜ同じ答えしか出なかったのか答えを見つけた
  • 「画像生成で首位逆転」ChatGPT新モデルで速度4倍、Geminiを上回る評価!
  • 「次の戦場は虫が制する?」放射線にも死なない“ゴキブリ諜報員”の異常進化

こんな記事も読まれています

  • レクサスがLFA・コンセプト正式公開、完全電動で何を“捨てた”のか
  • 冬になると必ず探される、後悔を減らす装備オプション
  • 「雪道は危険」の常識が崩れた、EVに隠されていた切り札
  • 「今すぐ廃車すべきだ!」想定を超えた中国製EVのセキュリティ問題
  • 「センザンコウまで冷凍庫に」ロンドンで違法野生肉38kgを大量押収、誰の食卓に届く寸前だったのか
  • 10年間毎日来た78歳が突然消えた、シェフが自宅で聞いた助けての一言
  • 「殺すつもりはなかった」夫の重要部位切断、深夜のカフェで起きた異常事態
  • テイラー・スウィフトが悪用最多? AIディープフェイク詐欺が狙う次の標的は誰だ

こんな記事も読まれています

  • レクサスがLFA・コンセプト正式公開、完全電動で何を“捨てた”のか
  • 冬になると必ず探される、後悔を減らす装備オプション
  • 「雪道は危険」の常識が崩れた、EVに隠されていた切り札
  • 「今すぐ廃車すべきだ!」想定を超えた中国製EVのセキュリティ問題
  • 「センザンコウまで冷凍庫に」ロンドンで違法野生肉38kgを大量押収、誰の食卓に届く寸前だったのか
  • 10年間毎日来た78歳が突然消えた、シェフが自宅で聞いた助けての一言
  • 「殺すつもりはなかった」夫の重要部位切断、深夜のカフェで起きた異常事態
  • テイラー・スウィフトが悪用最多? AIディープフェイク詐欺が狙う次の標的は誰だ

おすすめニュース

  • 1
    「62億ウォン横領容疑」パク・スホンの実兄に一部無罪判断…ネット反発

    エンタメ 

  • 2
    カン・テオ、視聴率1%台の「物足りなさ」を完全払拭…除隊後3年で「エンディング職人」に

    エンタメ 

  • 3
    『最初の男』1人2役でハム・ウンジョン登場…正反対の人生を歩む双子が邂逅?

    エンタメ 

  • 4
    キーの活動休止余波…「ハルミョンス」動画の公開日程を変更「理解をお願いしたい」

    エンタメ 

  • 5
    「イム・チャンジョンの妻」ソ・ハヤン、誰から受け取ったのか…カフェで捉えられた高級ブランドのショッピングバッグ

    エンタメ 

話題

  • 1
    配達アルバイト体験で庶民を愚弄と批判相次ぐ…ハン・ガインの最悪な近況

    エンタメ 

  • 2
    人気女優が贈る新曲『Wish to Wish』、心温まる歌詞に感動の声続出!

    エンタメ 

  • 3
    300年ぶりの大洪水が暴いた不倫…ホテルに“孤立”した銀行支店長、同室女性を「妻」と主張した末路

    トレンド 

  • 4
    食って稼いで、翌日急死…相次ぐ“大食い系インフルエンサー死亡”に専門家が冷や水

    トレンド 

  • 5
    「大人は見てるだけ?」凍った湖に落ちた4歳児、助けに行ったのは“13歳の少女”だった中国の現場

    トレンド 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]