メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

ディープシーク、長文処理の計算コストを大幅削減・推論速度を11.6倍向上…次世代AIモデルの鍵を握る「NSA」発表

佐藤美穂 アクセス  

高効率生成型人工知能(AI)モデルで世界的な旋風を巻き起こしたディープシークが長文を迅速に訓練し、推論できる最新技術を公開した。

19日、ディープシークのX公式アカウントによると、創業者の梁元峰氏を含むディープシークの開発チームは「NSA(Native Sparse Attention)」と名付けた新たなアテンションメカニズムを紹介する論文を、論文共有サイト「arXiv」に公開した。

ディープシークは論文の中で「長文(long-context)モデリングは次世代言語モデルにおいて極めて重要だが、標準的なアテンション(Attention)メカニズムの高い計算コストが大きな課題となっている」とし、「『スパース(sparse)アテンション』を活用することで、モデルの性能を維持しながら計算効率を改善できる」と述べた。

従来の「フル(Full)アテンション」メカニズムは、全てのトークン(AIモデルで処理されるデータ単位)間の関係を計算するシーケンス(文章の長さ)が増えるほど、計算負荷が指数関数的に増大するという問題があった。そのため、AI業界では一部のトークンのみを選択して計算する「スパースアテンション」の研究が活発に行われている。

ディープシークは「効率的な長文モデリングのためにアルゴリズム革新とハードウェア最適化を組み合わせた『生来的に訓練可能なスパースアテンション(NSA)』メカニズムを発表する」とし、「NSAは動的階層化(dynamic hierarchical)スパース戦略を採用し、トークンの圧縮と選択を組み合わせた」と説明した。

近年、AIモデルはChatGPTを開発したOpenAIの「o」シリーズやディープシークの「R1」、Googleの「Gemini 2.0」など、推論(reasoning)モデルが主流となり、長文処理能力がより一層求められている。

ディープシークが開発したNSAは、重要でないトークンを圧縮し、必須のトークンのみを選択して計算コストを削減し、処理速度を向上させる「動的階層化」スパース戦略を適用した。

ディープシークはフルアテンションとNSAのベンチマーク(性能比較)テストでは、NSAのスコアが高く、64Kシーケンス処理速度を比較した結果、デコーディングはNSAが11.6倍速く、逆伝播(backpropagation)も6倍速かったと主張した。

佐藤美穂
CP-2023-0299@fastviewkorea.com

コメント0

300

コメント0

[IT・テック] ランキング

  • 米有人月面計画に“1年以上遅延”発覚、スペースXの新日程がNASAを揺らす
  • 「人間の代わりになるのか」ロシア発AI CAの実力とは
  • 「史上最大の問題作か」...iPhone 17 Pro、背面が勝手に浮く?ユーザーが指摘する“構造欠陥”の可能性
  • 「6,000mAhに迫る怪物バッテリー」Apple初の折りたたみiPhoneが“歴代最大級”の化け物スペックで登場へ
  • 「ステルス塗料の“匂い”まで極秘」中国の軍事挑戦に、米国が答えた…『B-21』
  • 【遂に覚醒】アップル、iPhone発売を「年2回」へ大転換!10年以上続いた“秋の新作発表”に終止符

こんな記事も読まれています

  • 高油価に“最後の砦”、時速60〜80kmで燃費が激変
  • 日本車が韓国VIP市場で存在感? アルファードとLMが高級軸を塗り替える
  • アンジェリーナ・ジョリー、多彩な車庫構成に“生活重視”の姿が見える
  • 「ライト越しに赤ランプ点灯」冬朝に増える“危険な初期サイン”
  • 高油価に“最後の砦”、時速60〜80kmで燃費が激変
  • 米有人月面計画に“1年以上遅延”発覚、スペースXの新日程がNASAを揺らす
  • 日本車が韓国VIP市場で存在感? アルファードとLMが高級軸を塗り替える
  • 【友人の裏切り】当選した宝くじの写真をSNSに上げた瞬間…まさかの“電撃乗っ取り”被害!

こんな記事も読まれています

  • 高油価に“最後の砦”、時速60〜80kmで燃費が激変
  • 日本車が韓国VIP市場で存在感? アルファードとLMが高級軸を塗り替える
  • アンジェリーナ・ジョリー、多彩な車庫構成に“生活重視”の姿が見える
  • 「ライト越しに赤ランプ点灯」冬朝に増える“危険な初期サイン”
  • 高油価に“最後の砦”、時速60〜80kmで燃費が激変
  • 米有人月面計画に“1年以上遅延”発覚、スペースXの新日程がNASAを揺らす
  • 日本車が韓国VIP市場で存在感? アルファードとLMが高級軸を塗り替える
  • 【友人の裏切り】当選した宝くじの写真をSNSに上げた瞬間…まさかの“電撃乗っ取り”被害!

おすすめニュース

  • 1
    「歩道橋に人間がぶら下がっている!」英歌手が“自殺寸前の男性”を20秒で救出、ネットで称賛の嵐

    トレンド 

  • 2
    「売春やめれば1万ユーロ」、46歳年下エスコートに溺れ巨額被害

    トレンド 

  • 3
    「ぼくを連れて行って…」リポーターに思いきり抱きついた保護犬、その後の物語は?

    トレンド 

  • 4
    「世界最大級の東電原発・柏崎刈羽6号機が再稼働へ」…福島事故後初の復活に新潟知事が容認方針を固める

    トレンド 

  • 5
    【罪悪感なし】食品に“抗生物質”混入の中国飲食店!検察の調査で「腹痛防止のため」と驚きの言い訳

    トレンド 

話題

  • 1
    【感動】体外受精で誕生した5歳息子の才能が話題に…タレント・サユリが明かす息子の日常

    エンタメ 

  • 2
    原作ファンも驚き!『親愛なるX』ドラマ化でウェブ漫画の閲覧数が“17倍”も急増

    エンタメ 

  • 3
    TWICE・ダヒョンが青春ドラマのヒロインに!『ラブ・ミー』で見せる初々しい恋の揺れに胸キュン

    エンタメ 

  • 4
    元メジャーリーガーの挑戦に驚愕?ラーメンからタイ料理まで次々とオープンし“連続創業”というあだ名も

    エンタメ 

  • 5
    日本EVの競争力に黄信号!?シャオミ利益81%増が見せた現実

    モビリティー 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]