メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

ディープシーク、長文処理の計算コストを大幅削減・推論速度を11.6倍向上…次世代AIモデルの鍵を握る「NSA」発表

佐藤美穂 アクセス  

高効率生成型人工知能(AI)モデルで世界的な旋風を巻き起こしたディープシークが長文を迅速に訓練し、推論できる最新技術を公開した。

19日、ディープシークのX公式アカウントによると、創業者の梁元峰氏を含むディープシークの開発チームは「NSA(Native Sparse Attention)」と名付けた新たなアテンションメカニズムを紹介する論文を、論文共有サイト「arXiv」に公開した。

ディープシークは論文の中で「長文(long-context)モデリングは次世代言語モデルにおいて極めて重要だが、標準的なアテンション(Attention)メカニズムの高い計算コストが大きな課題となっている」とし、「『スパース(sparse)アテンション』を活用することで、モデルの性能を維持しながら計算効率を改善できる」と述べた。

従来の「フル(Full)アテンション」メカニズムは、全てのトークン(AIモデルで処理されるデータ単位)間の関係を計算するシーケンス(文章の長さ)が増えるほど、計算負荷が指数関数的に増大するという問題があった。そのため、AI業界では一部のトークンのみを選択して計算する「スパースアテンション」の研究が活発に行われている。

ディープシークは「効率的な長文モデリングのためにアルゴリズム革新とハードウェア最適化を組み合わせた『生来的に訓練可能なスパースアテンション(NSA)』メカニズムを発表する」とし、「NSAは動的階層化(dynamic hierarchical)スパース戦略を採用し、トークンの圧縮と選択を組み合わせた」と説明した。

近年、AIモデルはChatGPTを開発したOpenAIの「o」シリーズやディープシークの「R1」、Googleの「Gemini 2.0」など、推論(reasoning)モデルが主流となり、長文処理能力がより一層求められている。

ディープシークが開発したNSAは、重要でないトークンを圧縮し、必須のトークンのみを選択して計算コストを削減し、処理速度を向上させる「動的階層化」スパース戦略を適用した。

ディープシークはフルアテンションとNSAのベンチマーク(性能比較)テストでは、NSAのスコアが高く、64Kシーケンス処理速度を比較した結果、デコーディングはNSAが11.6倍速く、逆伝播(backpropagation)も6倍速かったと主張した。

佐藤美穂
editor@kangnamtimes.com

コメント0

300

コメント0

[IT・テック] ランキング

  • スマホが高くなるのに進化しない、メモリ高騰が生んだ最悪の選択
  • 「衝突寸前200m」スターリンクと中国衛星が急接近、低軌道は限界なのか
  • 「アップルの刷新計画が止まらない!」MacBook Pro、5年ぶりの大幅見直し ディスプレイなど軒並み変更か
  • 「ほぼ折り畳めるiPad?」脱・スマホ型!“横長”iPhoneFoldで動画視聴が激変か
  • 「AIバブルに針が刺さる」オープンソース急拡大、独占前提が揺らぐ瞬間
  • 「ロシアがここまで来た?」量子コンピューター実証発表、技術競争が一段階上へ

こんな記事も読まれています

  • 日産が中国で“コスパ怪物”投入、中国EVの土俵に立った瞬間
  • 冬の朝に増える“立てワイパー”、メーカー設計とズレた使い方が痛手に
  • 「来年、本当のEV戦争が始まる」第3世代電気自動車に世界が注目する理由
  • 「最先端だからといって最善ではない」便利の裏で広がるユーザーの不満連鎖
  • 「一週間で体が変わった」栄養士が毎日食べたブロッコリーの結果
  • 「マスクだけでは足りない」空気が悪い日の健康管理法
  • 「同年代より若く見える理由」老化を二倍遅らせた多言語の力
  • スマホが高くなるのに進化しない、メモリ高騰が生んだ最悪の選択

こんな記事も読まれています

  • 日産が中国で“コスパ怪物”投入、中国EVの土俵に立った瞬間
  • 冬の朝に増える“立てワイパー”、メーカー設計とズレた使い方が痛手に
  • 「来年、本当のEV戦争が始まる」第3世代電気自動車に世界が注目する理由
  • 「最先端だからといって最善ではない」便利の裏で広がるユーザーの不満連鎖
  • 「一週間で体が変わった」栄養士が毎日食べたブロッコリーの結果
  • 「マスクだけでは足りない」空気が悪い日の健康管理法
  • 「同年代より若く見える理由」老化を二倍遅らせた多言語の力
  • スマホが高くなるのに進化しない、メモリ高騰が生んだ最悪の選択

おすすめニュース

  • 1
    アダルト女優とも…「不倫520回」した夫を病院へ連れて行った妻「それでも離婚しない」理由とは

    気になる 

  • 2
    「絶対につぶすな」顔の“死の三角形”ニキビ、脳感染寸前まで悪化

    ヒント 

  • 3
    「進化か、滅亡か」ホッキョクグマ、温暖化で“遺伝子を書き換え始めた”

    トレンド 

  • 4
    「除雪費がない…」米農村、追い詰められた住民が“肌色のカレンダー”で資金調達

    トレンド 

  • 5
    「家族は私たちが守るニャ!」小さな飼い主の“笑顔”のために...いつも寄り添う犬猫に世界がほっこり

    フォトニュース 

話題

  • 1
    「1日2本でも危険!」少量喫煙でも“死亡リスク”60%増...禁煙こそが“最善策”

    ライフスタイル 

  • 2
    「子ども1人で2,100万円超」高校卒業までにかかる“現実の子育てコスト”が判明

    トレンド 

  • 3
    【驚愕】”1時間4万円”で心身リラックス?米で流行中のセラピーとは?

    トレンド 

  • 4
    「女性の子宮を搾取した!」代理出産で四つ子を授かった台湾の‟同性カップル”に批判殺到

    トレンド 

  • 5
    デビュー22年目の初快挙――人気アイドル出身歌手キム・ジェジュン、芸能大賞で優秀賞を受賞

    エンタメ 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]