メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

OpenAI、音声モデル「GPT-リアルタイム」を公開 企業向け音声AI市場で存在感を一気に拡大

望月博樹 アクセス  

引用:depositphotos*この画像は記事の内容と一切関係ありません
引用:depositphotos*この画像は記事の内容と一切関係ありません

企業向け音声AI市場で競争が激化する中、オープンAI(OpenAI)は新たな音声モデル「GPT-リアルタイム(gpt-realtime)」を公開し、存在感を強めた。同モデルは複雑な指示を正確に処理し、自然な音声で応答する機能を備えており、顧客対応や学習支援など多様な企業環境での活用が見込まれている。

オープンAIは最近、リアルタイム対応を強化した「リアルタイムAPI」を全面公開し、GPT-リアルタイムとともに新たな音声「シダー(Cedar)」と「マリン(Marin)」を発表した。同社によれば、これらのモデルは顧客相談や教育指導に近い環境で訓練されており、音声AIの正確性に加え、文脈に応じた感情表現の精度も向上した。

GPT-リアルタイムの特徴は、単なるテキスト音声変換を超え、音声間対話(speech-to-speech)を可能にする点にある。ユーザーの音声を即時に認識・理解し、自然な音声で応答することで、人間との対話に近い体験を提供する。活用例としては、製品返品にAI相談員が対応する場合や、不動産プラットフォームで条件に合う物件を推薦する場合などがある。

オープンAIは、このモデルが自社の音声モデルの中で最も高度な商用版だと強調し、発話の途中でも言語を切り替えることが可能だと説明した。従来モデルより複雑な指示を解釈・実行できるため、「フランス語のアクセントで強調して話せ」といった具体的な要求にも対応するとした。

新技術が登場した一方で、市場には既にイレブンラボ(ElevenLabs)、サウンドハウンド(SoundHound)、ヒューム(Hume)など有力な競合が存在する。各社は独自の強みを打ち出して優位性を確保しており、イレブンラボは昨年5月、精密な音声間対話機能を備えた「Conversation AI 2.0」を公開した。

さらに、ミストラル(Mistral)の「ボックストラル(Voxtral)」はリアルタイム翻訳の最適化を目指し、グーグル(GOOGL)はノートブックLMに音声機能を組み込み、研究メモをポッドキャスト形式に再構成できるよう改良を進めている。

GPT-リアルタイムの強みの一つは、指示遂行能力の向上と音声認識精度の改善にある。評価指標「BigBench Audio」では82.8%を記録し、従来モデルの65.6%から大幅に改善した。「MultiChallenge」オーディオベンチマークでも30.5%を示し、競争優位性を確立した。

指示実行に必要なツールへの自動接続機能も強化された。オープンAIは中核インフラであるリアルタイムAPIも同時にアップグレードし、MCPサポート、画像入力認識機能、SIP接続機能などを追加した。これにより、電話を介した顧客センターでのリアルタイム応答が可能になったほか、API内で保存したプロンプトを再利用できるようになり、企業利用の効率も高まった。

初期ユーザーからは概ね好意的な反応が寄せられた。ある開発者は「音声品質が向上し、指示への忠実度と応答速度も向上した」と述べ、別のユーザーは「外部システムと円滑に連携するSIPおよびMCP機能が今回の発表の核心だ」と評価した。

一方、課題としてはカスタムボイス機能の欠如とコスト負担が指摘されている。GPT-リアルタイムは最近、価格を約20%引き下げ、入力トークン100万個当たり32ドル(約4,707円)、出力トークン100万個当たり64ドル(約9,414円)に設定したが、従来のTTS-LLM-STT構造と比べて依然として割高との声がある。

企業向け音声AIの成否は、技術的完成度に加え、日常業務システムへの円滑な統合に左右される。オープンAIのGPT-リアルタイムが実際に成果を上げるかどうかは、市場の反応にかかっている。

望月博樹
CP-2023-0364@fastviewkorea.com

コメント0

300

コメント0

[IT・テック] ランキング

  • Apple、発熱問題に決着か?iPhone 17に続きiPadも“液体冷却システム”採用へ
  • 「人を切って、マシンを肥やす」米ビッグテック3社、“AI投資”のために5万人リストラ!
  • 「マスクを逃しちゃ、ダメ!」テスラ取締役会、株主に“異例の懇願” “1兆ドル報酬案”否決ならCEO辞任も
  • 【Apple信者必見】iPhone 18は「プラトー」デザイン継続…iPhone 17eには“変化の風”
  • 次世代iPad Pro、遂に“ベイパーチャンバー冷却”搭載!ファンレスでも長時間の“高負荷作業”が可能に
  • 【超大型投資】OpenAI上場へ“孫マネー”が再び動く!ソフトバンク、“3兆円規模”の第2次出資を決定

こんな記事も読まれています

  • 「デザイナー絶句」…AIが創った“スーパーカー”が自動車デザインを塗り替える!
  • 【トヨタの本気】新型プリウス、燃費も走りも妥協なし…“静かな革命”が始まる
  • ネヴェーラ、“1.81秒×時速412km”で電気の限界を超えた「究極のハイパーカー」公開!
  • 【2025年版】信頼性が最も低い新車トップ10…CR調査でフォード勢がワースト独占
  • トランプ氏、訪日で“ビジネスマン”全開!日本企業に「対米投資拡大」と「レアアース協力」を直訴
  • 「ハマスが裏切った!」イスラエル、休戦合意にもかかわらず空爆再開…少なくとも7人死亡
  • 「政府が止まっても同盟は止まらない!」米空軍、“死の白鳥”B-1Bを日本へ…中・露・北を1時間で射程圏内に
  • 「政治介入の代償か」…マスク氏の政治行動でテスラ最大126万台“販売減”、競合EVは17〜22%増

こんな記事も読まれています

  • 「デザイナー絶句」…AIが創った“スーパーカー”が自動車デザインを塗り替える!
  • 【トヨタの本気】新型プリウス、燃費も走りも妥協なし…“静かな革命”が始まる
  • ネヴェーラ、“1.81秒×時速412km”で電気の限界を超えた「究極のハイパーカー」公開!
  • 【2025年版】信頼性が最も低い新車トップ10…CR調査でフォード勢がワースト独占
  • トランプ氏、訪日で“ビジネスマン”全開!日本企業に「対米投資拡大」と「レアアース協力」を直訴
  • 「ハマスが裏切った!」イスラエル、休戦合意にもかかわらず空爆再開…少なくとも7人死亡
  • 「政府が止まっても同盟は止まらない!」米空軍、“死の白鳥”B-1Bを日本へ…中・露・北を1時間で射程圏内に
  • 「政治介入の代償か」…マスク氏の政治行動でテスラ最大126万台“販売減”、競合EVは17〜22%増

おすすめニュース

  • 1
    「娘を汚したな!」不倫男を棒でリンチ…“制裁”で死亡させたインドの家族

    トレンド 

  • 2
    「すべてを消し去る」トランプ、米海軍14隻を集結…侵攻寸前の“あの国”で何が起きているのか

    フォトニュース 

  • 3
    「ついに日本も核保有?」…中国牽制を掲げて動き出す“核推進潜水艦”計画の衝撃

    フォトニュース 

  • 4
    「一生女として生きてきたのに...」32歳女性、産婦人科受診で“本当の性別”を知り、衝撃!

    トレンド 

  • 5
    「微笑の裏に快楽と犯罪帝国...」23歳美女インフルエンサーの“衝撃的な正体”にブラジル騒然!

    トレンド 

話題

  • 1
    「一晩のうちに1,000脚が消えた...」スペインの首都で椅子が大量に盗まれるワケとは?

    トレンド 

  • 2
    【完全に男】女子競泳界を席巻した米・水泳選手、「性別確認拒否」で世界水泳連盟から制裁!

    トレンド 

  • 3
    【衝撃】若い太陽は地球を襲う「宇宙の嵐」だった!初期地球に降り注いだ“宇宙放射線”の恐怖

    Uncategorized 

  • 4
    ENHYPEN、1年のワールドツアー完走…ソウルで「感動のフィナーレ」

    K-POP 

  • 5
    来春ニューアルバム発売&世界65公演ツアー準備中…6年ぶりの完全復帰へ

    HYBEアイドル 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]