メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

OpenAI、音声モデル「GPT-リアルタイム」を公開 企業向け音声AI市場で存在感を一気に拡大

望月博樹 アクセス  

引用:depositphotos*この画像は記事の内容と一切関係ありません
引用:depositphotos*この画像は記事の内容と一切関係ありません

企業向け音声AI市場で競争が激化する中、オープンAI(OpenAI)は新たな音声モデル「GPT-リアルタイム(gpt-realtime)」を公開し、存在感を強めた。同モデルは複雑な指示を正確に処理し、自然な音声で応答する機能を備えており、顧客対応や学習支援など多様な企業環境での活用が見込まれている。

オープンAIは最近、リアルタイム対応を強化した「リアルタイムAPI」を全面公開し、GPT-リアルタイムとともに新たな音声「シダー(Cedar)」と「マリン(Marin)」を発表した。同社によれば、これらのモデルは顧客相談や教育指導に近い環境で訓練されており、音声AIの正確性に加え、文脈に応じた感情表現の精度も向上した。

GPT-リアルタイムの特徴は、単なるテキスト音声変換を超え、音声間対話(speech-to-speech)を可能にする点にある。ユーザーの音声を即時に認識・理解し、自然な音声で応答することで、人間との対話に近い体験を提供する。活用例としては、製品返品にAI相談員が対応する場合や、不動産プラットフォームで条件に合う物件を推薦する場合などがある。

オープンAIは、このモデルが自社の音声モデルの中で最も高度な商用版だと強調し、発話の途中でも言語を切り替えることが可能だと説明した。従来モデルより複雑な指示を解釈・実行できるため、「フランス語のアクセントで強調して話せ」といった具体的な要求にも対応するとした。

新技術が登場した一方で、市場には既にイレブンラボ(ElevenLabs)、サウンドハウンド(SoundHound)、ヒューム(Hume)など有力な競合が存在する。各社は独自の強みを打ち出して優位性を確保しており、イレブンラボは昨年5月、精密な音声間対話機能を備えた「Conversation AI 2.0」を公開した。

さらに、ミストラル(Mistral)の「ボックストラル(Voxtral)」はリアルタイム翻訳の最適化を目指し、グーグル(GOOGL)はノートブックLMに音声機能を組み込み、研究メモをポッドキャスト形式に再構成できるよう改良を進めている。

GPT-リアルタイムの強みの一つは、指示遂行能力の向上と音声認識精度の改善にある。評価指標「BigBench Audio」では82.8%を記録し、従来モデルの65.6%から大幅に改善した。「MultiChallenge」オーディオベンチマークでも30.5%を示し、競争優位性を確立した。

指示実行に必要なツールへの自動接続機能も強化された。オープンAIは中核インフラであるリアルタイムAPIも同時にアップグレードし、MCPサポート、画像入力認識機能、SIP接続機能などを追加した。これにより、電話を介した顧客センターでのリアルタイム応答が可能になったほか、API内で保存したプロンプトを再利用できるようになり、企業利用の効率も高まった。

初期ユーザーからは概ね好意的な反応が寄せられた。ある開発者は「音声品質が向上し、指示への忠実度と応答速度も向上した」と述べ、別のユーザーは「外部システムと円滑に連携するSIPおよびMCP機能が今回の発表の核心だ」と評価した。

一方、課題としてはカスタムボイス機能の欠如とコスト負担が指摘されている。GPT-リアルタイムは最近、価格を約20%引き下げ、入力トークン100万個当たり32ドル(約4,707円)、出力トークン100万個当たり64ドル(約9,414円)に設定したが、従来のTTS-LLM-STT構造と比べて依然として割高との声がある。

企業向け音声AIの成否は、技術的完成度に加え、日常業務システムへの円滑な統合に左右される。オープンAIのGPT-リアルタイムが実際に成果を上げるかどうかは、市場の反応にかかっている。

望月博樹
CP-2023-0364@fastviewkorea.com

コメント0

300

コメント0

[IT・テック] ランキング

  • 「テスラ、欧州で大コケ!」7か月連続不振で7月販売40%減...一方BYDは225%急増、シェア急拡大!
  • 米OpenAI×Anthropic、AIモデルクロステストで危険性露呈!GPT系モデル、一部は「悪用に脆弱」
  • 「天才集結のはずが」…Metaの“超知能研究所”、発足2カ月で最重要人材が相次ぎ退社!ザッカーバーグの大型計画に暗雲
  • 【バドミントン革命】シャトルを追跡して打ち返すロボット ETH研究チームがバドミントン制御に成功
  • 米国の「50%関税」も怖くない?スズキ、インドEV事業に「1兆円超」投資!その狙いは?
  • 【初成功】スペースXのスターシップ、爆発続きからついに8基の衛星投入に成功

こんな記事も読まれています

  • 【特集】595kg・2.8秒の軽量スポーツ!A110 R 70からBACモノまで、狂気のピュア5台に迫る
  • 【危機】日産ついに世界10位圏外へ!16年ぶり最低販売台数161万台、BYDと吉利に抜かれ国内も過去最悪水準
  • 【25周年】VWゴルフRにRS3の5気筒ターボ移植!394馬力超・0-100km/h3秒台の歴代最速ハッチへ
  • 【最終章】日産GT-R R35 18年間の熱狂に幕!爆音V6ツインターボが刻んだ「伝説と進化」
  • “第2の全盛期”ヨム・ジョンア、映画からドラマまで無双!10年愛チャン・ドンゴンとの過去も再注目
  • G.NA、「よぉ 久しぶり」セルフィー投稿にネット騒然!2016年“あの事件”から8年…衝撃の近況公開
  • チュ・ジンモ、ゴルフ撮影中に「奇跡のホールインワン」達成…2,700万ウォン相当ロレックスを手にし歓喜の瞬間!
  • エヌビディアCEO「AIが週4日勤務を現実にするかもしれない」…一方で“かえって過酷に働く未来”に警鐘

こんな記事も読まれています

  • 【特集】595kg・2.8秒の軽量スポーツ!A110 R 70からBACモノまで、狂気のピュア5台に迫る
  • 【危機】日産ついに世界10位圏外へ!16年ぶり最低販売台数161万台、BYDと吉利に抜かれ国内も過去最悪水準
  • 【25周年】VWゴルフRにRS3の5気筒ターボ移植!394馬力超・0-100km/h3秒台の歴代最速ハッチへ
  • 【最終章】日産GT-R R35 18年間の熱狂に幕!爆音V6ツインターボが刻んだ「伝説と進化」
  • “第2の全盛期”ヨム・ジョンア、映画からドラマまで無双!10年愛チャン・ドンゴンとの過去も再注目
  • G.NA、「よぉ 久しぶり」セルフィー投稿にネット騒然!2016年“あの事件”から8年…衝撃の近況公開
  • チュ・ジンモ、ゴルフ撮影中に「奇跡のホールインワン」達成…2,700万ウォン相当ロレックスを手にし歓喜の瞬間!
  • エヌビディアCEO「AIが週4日勤務を現実にするかもしれない」…一方で“かえって過酷に働く未来”に警鐘

おすすめニュース

  • 1
    「ご飯はどこ…?」空っぽのフードボウルを見つめ、今にも泣きそうな表情を浮かべた犬

    おもしろ 

  • 2
    「こうすればいいのかニャ?」棚の取り付けを手伝おうと二本足で立ちメジャーを押さえる健気な猫

    おもしろ 

  • 3
    フライドポテトは「最悪の食品」だった! 老化・糖尿病・心疾患を招く危険なメカニズムを専門医が警告

    ライフスタイル 

  • 4
    「ゾンビタバコ」沖縄から爆発的拡散!若者を廃人にする“第2のプロポフォール”、アジア全域を侵食中

    トレンド 

  • 5
    ぬいぐるみじゃない!見た瞬間に心を奪う“黒い鼻の羊”の衝撃ビジュアル

    フォトニュース 

話題

  • 1
    仲間外れのライオンに「救いの手」を差し伸べた犬…想像を超える絆が生まれた瞬間

    トレンド 

  • 2
    「交通相の暴走」時速225kmで激走動画をSNS公開し炎上…自首してなお“意図はなかった”と強弁

    トレンド 

  • 3
    アメリカが「巨大な壁」に囲まれる? トランプ政権以降、入国審査がかつてなく厳格化…SNSや写真・メッセージまで検査で波紋

    トレンド 

  • 4
    「みんな会いたいな」亡き友達の写真を見つめる犬ピンの姿にSNS反響、胸を締めつける映像が話題に

    トレンド 

  • 5
    【前兆症状】41歳でアルツハイマー診断 平均より30年早い発症と映画の記憶喪失

    ライフスタイル 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]