メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

ディープシーク、長文処理の計算コストを大幅削減・推論速度を11.6倍向上…次世代AIモデルの鍵を握る「NSA」発表

佐藤美穂 アクセス  

高効率生成型人工知能(AI)モデルで世界的な旋風を巻き起こしたディープシークが長文を迅速に訓練し、推論できる最新技術を公開した。

19日、ディープシークのX公式アカウントによると、創業者の梁元峰氏を含むディープシークの開発チームは「NSA(Native Sparse Attention)」と名付けた新たなアテンションメカニズムを紹介する論文を、論文共有サイト「arXiv」に公開した。

ディープシークは論文の中で「長文(long-context)モデリングは次世代言語モデルにおいて極めて重要だが、標準的なアテンション(Attention)メカニズムの高い計算コストが大きな課題となっている」とし、「『スパース(sparse)アテンション』を活用することで、モデルの性能を維持しながら計算効率を改善できる」と述べた。

従来の「フル(Full)アテンション」メカニズムは、全てのトークン(AIモデルで処理されるデータ単位)間の関係を計算するシーケンス(文章の長さ)が増えるほど、計算負荷が指数関数的に増大するという問題があった。そのため、AI業界では一部のトークンのみを選択して計算する「スパースアテンション」の研究が活発に行われている。

ディープシークは「効率的な長文モデリングのためにアルゴリズム革新とハードウェア最適化を組み合わせた『生来的に訓練可能なスパースアテンション(NSA)』メカニズムを発表する」とし、「NSAは動的階層化(dynamic hierarchical)スパース戦略を採用し、トークンの圧縮と選択を組み合わせた」と説明した。

近年、AIモデルはChatGPTを開発したOpenAIの「o」シリーズやディープシークの「R1」、Googleの「Gemini 2.0」など、推論(reasoning)モデルが主流となり、長文処理能力がより一層求められている。

ディープシークが開発したNSAは、重要でないトークンを圧縮し、必須のトークンのみを選択して計算コストを削減し、処理速度を向上させる「動的階層化」スパース戦略を適用した。

ディープシークはフルアテンションとNSAのベンチマーク(性能比較)テストでは、NSAのスコアが高く、64Kシーケンス処理速度を比較した結果、デコーディングはNSAが11.6倍速く、逆伝播(backpropagation)も6倍速かったと主張した。

佐藤美穂
CP-2023-0299@fastviewkorea.com

コメント0

300

コメント0

[IT・テック] ランキング

  • 「ついにグーグルに頼った!」アップル、Siriに“他社AI”導入、“自前主義”崩壊か
  • 【iPad代替】15万円以下の「MacBook SE」開発へ?iPhoneチップ搭載で価格革命
  • 「話すだけで伝わる」AirPodsに新機能、リアルタイム翻訳が始動…電話・FaceTimeでも対応
  • 米裁判所、サムスンのOLED特許侵害を認定…295億円の賠償命令
  • 「ウランを使わない」中国、ゴビ砂漠で“トリウム原子炉”実験に世界初成功…“核の常識”が変わる瞬間
  • 「中国軍、ロボットウルフを上陸訓練に投入」時速40キロで突撃する“鉄の獣”が示した、戦争の新時代

こんな記事も読まれています

  • BMW、トヨタと手を組み次世代燃料電池を本格開発 「iX5ハイドロジェン」公開、MINIはポール・スミスの感性を纏う
  • 「洗車しすぎは塗装の敵、専門家が警鐘」車を長持ちさせる最適な頻度とは
  • AIではなく人へ…トヨタ、“モビリティの意味”を問い直す
  • ダイハツ、軽の枠を超える挑戦!FRスポーツで原点回帰
  • 「ネズミ退治も接客も担当!」SNSで大バズリ、世界を癒す“店番猫”たちの愛され術
  • 「この国は完璧だ!」と言い張ったトランプ氏…生活費高騰に怒った有権者が“経済審判”を下す
  • 「温室効果ガス排出量、過去最多に」…このままでは今世紀末“破局”は避けられない
  • 中国人民銀行、「10か月ぶりに」国債購入再開…景気刺激へ“本格転換”か

こんな記事も読まれています

  • BMW、トヨタと手を組み次世代燃料電池を本格開発 「iX5ハイドロジェン」公開、MINIはポール・スミスの感性を纏う
  • 「洗車しすぎは塗装の敵、専門家が警鐘」車を長持ちさせる最適な頻度とは
  • AIではなく人へ…トヨタ、“モビリティの意味”を問い直す
  • ダイハツ、軽の枠を超える挑戦!FRスポーツで原点回帰
  • 「ネズミ退治も接客も担当!」SNSで大バズリ、世界を癒す“店番猫”たちの愛され術
  • 「この国は完璧だ!」と言い張ったトランプ氏…生活費高騰に怒った有権者が“経済審判”を下す
  • 「温室効果ガス排出量、過去最多に」…このままでは今世紀末“破局”は避けられない
  • 中国人民銀行、「10か月ぶりに」国債購入再開…景気刺激へ“本格転換”か

おすすめニュース

  • 1
    ILLIT、日本でも止まらない快進撃!FNS歌謡祭2年連続出演…“トレンディの象徴”に

    エンタメ 

  • 2
    「お金なんて一銭もなくていい」お笑いタレントの明かす理想のタイプは“イケメン”だけ?

    エンタメ 

  • 3
    TWS、2年連続『FNS歌謡祭』出演決定!あの“清涼パフォーマンス”が再び日本へ

    エンタメ 

  • 4
    G-DRAGON「大衆の評価と自分の満足、その間で生きている」…10年ぶりの対談で語った自分なりの哲学

    エンタメ 

  • 5
    先輩も後輩も全力勝負!JYPに続き、STARSHIPアーティスト38人の“全国体育大会”開幕

    エンタメ 

話題

  • 1
    NCTジョンウ、入隊前に刻んだ“アーティストの証”…ミュージカルコンサート出演で圧巻のステージ

    エンタメ 

  • 2
    『CRAZY』を超えた! LE SSERAFIM、j-hopeと共に掴んだキャリアハイ Billboard自己最高記録達成

    エンタメ 

  • 3
    BOYNEXTDOOR、世界が認めた“セルフプロデュース力” Billboard6部門で好成績

    エンタメ 

  • 4
    韓国の国民的俳優アン・ソンギの近況に胸が痛む…親友パク・ジュンフンが語るエピソードに涙

    エンタメ 

  • 5
    アイドルから俳優までこなすド・ギョンス、俳優マネジメント事務所・Blitzwayエンタと専属契約へ

    エンタメ 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]