メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

OpenAI、音声モデル「GPT-リアルタイム」を公開 企業向け音声AI市場で存在感を一気に拡大

望月博樹 アクセス  

引用:depositphotos*この画像は記事の内容と一切関係ありません
引用:depositphotos*この画像は記事の内容と一切関係ありません

企業向け音声AI市場で競争が激化する中、オープンAI(OpenAI)は新たな音声モデル「GPT-リアルタイム(gpt-realtime)」を公開し、存在感を強めた。同モデルは複雑な指示を正確に処理し、自然な音声で応答する機能を備えており、顧客対応や学習支援など多様な企業環境での活用が見込まれている。

オープンAIは最近、リアルタイム対応を強化した「リアルタイムAPI」を全面公開し、GPT-リアルタイムとともに新たな音声「シダー(Cedar)」と「マリン(Marin)」を発表した。同社によれば、これらのモデルは顧客相談や教育指導に近い環境で訓練されており、音声AIの正確性に加え、文脈に応じた感情表現の精度も向上した。

GPT-リアルタイムの特徴は、単なるテキスト音声変換を超え、音声間対話(speech-to-speech)を可能にする点にある。ユーザーの音声を即時に認識・理解し、自然な音声で応答することで、人間との対話に近い体験を提供する。活用例としては、製品返品にAI相談員が対応する場合や、不動産プラットフォームで条件に合う物件を推薦する場合などがある。

オープンAIは、このモデルが自社の音声モデルの中で最も高度な商用版だと強調し、発話の途中でも言語を切り替えることが可能だと説明した。従来モデルより複雑な指示を解釈・実行できるため、「フランス語のアクセントで強調して話せ」といった具体的な要求にも対応するとした。

新技術が登場した一方で、市場には既にイレブンラボ(ElevenLabs)、サウンドハウンド(SoundHound)、ヒューム(Hume)など有力な競合が存在する。各社は独自の強みを打ち出して優位性を確保しており、イレブンラボは昨年5月、精密な音声間対話機能を備えた「Conversation AI 2.0」を公開した。

さらに、ミストラル(Mistral)の「ボックストラル(Voxtral)」はリアルタイム翻訳の最適化を目指し、グーグル(GOOGL)はノートブックLMに音声機能を組み込み、研究メモをポッドキャスト形式に再構成できるよう改良を進めている。

GPT-リアルタイムの強みの一つは、指示遂行能力の向上と音声認識精度の改善にある。評価指標「BigBench Audio」では82.8%を記録し、従来モデルの65.6%から大幅に改善した。「MultiChallenge」オーディオベンチマークでも30.5%を示し、競争優位性を確立した。

指示実行に必要なツールへの自動接続機能も強化された。オープンAIは中核インフラであるリアルタイムAPIも同時にアップグレードし、MCPサポート、画像入力認識機能、SIP接続機能などを追加した。これにより、電話を介した顧客センターでのリアルタイム応答が可能になったほか、API内で保存したプロンプトを再利用できるようになり、企業利用の効率も高まった。

初期ユーザーからは概ね好意的な反応が寄せられた。ある開発者は「音声品質が向上し、指示への忠実度と応答速度も向上した」と述べ、別のユーザーは「外部システムと円滑に連携するSIPおよびMCP機能が今回の発表の核心だ」と評価した。

一方、課題としてはカスタムボイス機能の欠如とコスト負担が指摘されている。GPT-リアルタイムは最近、価格を約20%引き下げ、入力トークン100万個当たり32ドル(約4,707円)、出力トークン100万個当たり64ドル(約9,414円)に設定したが、従来のTTS-LLM-STT構造と比べて依然として割高との声がある。

企業向け音声AIの成否は、技術的完成度に加え、日常業務システムへの円滑な統合に左右される。オープンAIのGPT-リアルタイムが実際に成果を上げるかどうかは、市場の反応にかかっている。

望月博樹
//= the_author_meta('email'); ?>editor@kangnamtimes.com

コメント0

300

コメント0

[IT・テック] ランキング

  • ブラック派がついに揺れるのか…iPhone18 Pro新色「ダークチェリー」に早くも本命説
  • 中国で世界初のロボット学校が開校…「ヒューマノイドも学校へ行く時代」に
  • 「AIバブルか、本物か」…孫正義がフランスに約13兆円を投じる“巨大計画”
  • AIデータセンターは本当に“電気を食う施設”なのか…米軍元中将が語った意外な役割
  • 「AIリストラ」は本当に避けられないのか…半導体王が経営者の“言い訳”を一刀両断
  • 「パスワードはもう危ない」…英情報トップが警告した中露スパイ戦の“次の標的”

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

こんな記事も読まれています

  • 生産中止から4年…WRX STIに“復活シグナル”、試されるのはファンの熱量?
  • 「大径ホイールの罠?」見た目は最強でも、ポットホール一発で財布が割れる
  • 「一般トヨタ店では買えない」GR GT、販売は“厳選レクサス店”に集約へ?
  • GM車3,500台がリコール対象、欠けていたのは説明書1冊
  • 米国が対EU追加関税推進、強制労働規制巡り対立激化
  • トランプ氏がイラン新指導者評価転換、海上封鎖解除に含み
  • 活動休止を経た元BIGBANGメンバー、横浜で約1万人規模の“無料ファンミーティング”開催
  • 恋人のプライベート映像の流出を防ぐために大麻事件を起こした? 23年ぶりに噂を完全否定「事実無根」

おすすめニュース

  • 1
    173cm・55kgの女優がラーメン4袋を完食…“吐き出し”疑惑にノーカットで大食いに挑む

    エンタメ 

  • 2
    12年間で兄に1000万以上の金銭支援をするも、勝手に200万分の株を売られ“絶縁”悩み中の弟

    エンタメ 

  • 3
    「給料は増えないのに、食費だけ高くなる」…食品2万品目値上げへ、家計直撃の現実

    トレンド 

  • 4
    「会社員時代には見られない金額」フリーに転向して半年足らずで“局アナ時代の年収”超え?

    エンタメ 

  • 5
    「居心地悪すぎた」遅咲きの歌手、30年の芸能人生最大の後悔は“5歳のサバ読み”?

    エンタメ 

話題

  • 1
    学歴詐称疑惑で干されるも濡れ衣だった…空白期間と生活苦を支えたのは“妻の毅然とした態度”

    エンタメ 

  • 2
    「笑いを取りたくてやりすぎた」先輩への発言が炎上した芸人、大衆の厳しい視線に心境を吐露

    エンタメ 

  • 3
    美人すぎて証明写真が悪用されまくった女優? 潔白証明のため裁判所に直接出向いた深刻被害

    エンタメ 

  • 4
    婚約者の妹を愛してしまう“禁断ロマンス”…芸人出身監督が手掛けたショートドラマに注目

    エンタメ 

  • 5
    “世紀のウェディング” デュア・リパが俳優カラム・ターナーと結婚、ロンドンの由緒あるホールで挙式

    エンタメ