メインメニューへスキップ(上段) メインコンテンツへスキップ メインメニューへスキップ(下段)

「4コマ漫画もお手の物」チャットGPTの新技術、DALL-E 3を超える多機能&高精度な画像生成技術とは?

川田翔平 アクセス  

引用:オープンAI
引用:オープンAI
引用:オープンAI
引用:オープンAI
引用:オープンAI
引用:オープンAI

オープンAIが自社の画像生成AIモデル「DALL-E 3」を「ChatGPT 4o Image Generation(以下チャットGPT画像)」に置き換える。チャットGPT画像は、オープンAIの生成AIモデル「GPT-4」のテキスト理解能力と高度な画像生成機能を搭載している。そのため、チャットGPT画像はDALL-E 3よりもはるかに複雑で高度な要求に応じた正確な画像を生成できる。オープンAIは近くチャットGPT画像をチャットGPTを通じて利用可能にする予定だ。

ユーザーの求める複雑な画像をそのまま生成

オープンAIは25日(現地時間)、韓国特派員らとのブリーフィングでチャットGPT画像を新たに発表した。オープンAIによると、チャットGPT画像は2023年9月に公開されたDALL-E 3以来、1年6か月ぶりに同社が発表する画像生成AIモデルだ。具体的なプロンプトを細かく入力してもDALL-E 3はユーザーのニーズを100%反映できず、アップグレードの必要性が指摘されてきたが、チャットGPT画像はDALL-E 3より機能が大幅に向上したという。

オープンAIは2021年1月に「DALL-E」を初めて発表し、2022年4月に改良版の「DALL-E 2」を公開後、継続的に画像生成AIを改良してきた。オープンAIはチャットGPT画像がDALL-E 3を完全に置き換えると説明した。ただし、DALL-E 3に慣れたユーザーのため、DALL-E 3のサービスは段階的に終了する。

オープンAIでマルチモーダル(テキスト、画像、音声の同時処理)業務を担当するガブリエル・ゴー氏は「チャットGPT画像はDALL-E 3のアップグレード版ではなく、全く新しい画像生成AIモデルだ」と強調した。チャットGPT画像によって、オープンAIの画像生成AIモデルが斬新さから実用性へと転換するという。

ユーザーの複雑な多段階の指示にも柔軟に対応できる点が大きな特徴だ。ユーザーが「青い星と赤い三角形」というプロンプトをチャットGPTに入力すると、チャットGPT画像がこれらの要素の属性を正確に反映し、ユーザーの求める画像を生成する仕組みだ。

オープンAIは「チャットGPT画像のテスト結果、このモデルは最大15種類のユーザーが求める物体を正確に生成できることが分かった」と説明した。さらに「これは従来のモデルであるDALL-E 3の性能を上回るものだ」と付け加えた。

引用:オープンAI
引用:オープンAI

 

効果的な教育資料の作成にも適している

チャットGPT画像はDALL-E 3とは異なり、常識から外れた画像生成が可能だ。

オープンAIでマルチモーダル業務を担当するジャッキー・サノン氏は「チャットGPT画像は三角形の車輪がついた自転車を描いてほしいというプロンプトが入力されると、DALL-E 3のように遅延することなく瞬時に三角形の車輪がついた画像を生成する」と説明した。また、正確なテキストとキャラクター配置を活用して4コマ漫画を生成し、物理学者ニュートンの既存のプリズム実験画像も多様に活用して新しい画像を作り出す。

そのため、オープンAIはチャットGPT画像の優れた機能が教育資料やグラフィック資料として有効活用されることを期待している。実際に、チャットGPT画像は教育用ポスター向けにビックブルーシロナガスクジラなど8種類のクジラを色を間違えずに正確に生成した。

サノン氏は「チャットGPT画像によって、AIは単に面白い特殊効果を生み出すだけでなく、実用的なツールとなるだろう」と予測した。さらに「オープンAIが誰でも簡単に詳細で正確な視覚資料を作成できる可能性を開くことができたことを嬉しく思う」と付け加えた。

チャットGPT画像は、オープンAIのユーザーであれば誰でも無料でチャットGPTを通じて使用できる。また、オープンAIの動画生成AIモデル「Sora」でもチャットGPT画像が活用される。チャットGPT画像は韓国語にも対応する。

ただし、英語のように韓国語でもチャットGPT画像がうまく機能するかは不明だ。オープンAI側は「今後、韓国語など他の言語でもチャットGPT画像が正確に機能するようアップデートしていく」と述べた。

川田翔平
CP-2023-0328@fastviewkorea.com

コメント0

300

コメント0

[IT・テック] ランキング

  • 「テスラ、完全自動運転の野望崩壊」...自動運転ゼロの“サイバーキャブ”、価格戦略と安全規制の狭間で揺れる!
  • 「AirPods Pro 3から変な音がするんだけど…」
  • 「20周年モデル最新情報!」2027年のiPhone、ついに“ベゼルゼロ×画面内Face ID”が現実に?
  • アップル製品の“高級化”加速!iPad mini 皮切りに“OLED”拡大、次世代モデルは“大幅値上げ”か
  • Apple、発熱問題に決着か?iPhone 17に続きiPadも“液体冷却システム”採用へ
  • 「人を切って、マシンを肥やす」米ビッグテック3社、“AI投資”のために5万人リストラ!

こんな記事も読まれています

  • ランボルギーニ「マニフェスト」が描く“美学の挑戦”…電動化の時代に響くデザイン哲学の鼓動
  • 【オーナー専用】ランボルギーニ「THE LOUNGE TOKYO」公開…六本木裏通りに潜む“秘密の聖域”
  • 【新型】スバルBRZ 2026年型登場 …「ピュアスポーツの原点」を現代に蘇らせる
  • 「アウディ×バイエルン」23年の絆が走り出す…RS e-tron GTが導く“電動の未来と情熱の共鳴”
  • 「テスラ、完全自動運転の野望崩壊」…自動運転ゼロの“サイバーキャブ”、価格戦略と安全規制の狭間で揺れる!
  • “偽軍人”に化けた配達員、女性医師に暴行!SNSで巧妙に接近か
  • 「110年前の悲劇が蘇る」…タイタニック一等席の名簿がオークションに登場!
  • 「北朝鮮は絶対崩れないのか?」極秘情報と脱北者証言からわかる“クーデター不可能”の現実

こんな記事も読まれています

  • ランボルギーニ「マニフェスト」が描く“美学の挑戦”…電動化の時代に響くデザイン哲学の鼓動
  • 【オーナー専用】ランボルギーニ「THE LOUNGE TOKYO」公開…六本木裏通りに潜む“秘密の聖域”
  • 【新型】スバルBRZ 2026年型登場 …「ピュアスポーツの原点」を現代に蘇らせる
  • 「アウディ×バイエルン」23年の絆が走り出す…RS e-tron GTが導く“電動の未来と情熱の共鳴”
  • 「テスラ、完全自動運転の野望崩壊」…自動運転ゼロの“サイバーキャブ”、価格戦略と安全規制の狭間で揺れる!
  • “偽軍人”に化けた配達員、女性医師に暴行!SNSで巧妙に接近か
  • 「110年前の悲劇が蘇る」…タイタニック一等席の名簿がオークションに登場!
  • 「北朝鮮は絶対崩れないのか?」極秘情報と脱北者証言からわかる“クーデター不可能”の現実

おすすめニュース

  • 1
    「通学路目前で暴走!」猛スピード左折→ノーブレーキ衝突...“高齢ドライバー”の危険運転に現場騒然

    フォトニュース 

  • 2
    青森・核燃料再処理工場で放射線被曝事故…作業員3人を緊急調査

    トレンド 

  • 3
    「ここを通るなら覚悟を…」札幌の“魔の交差点”で相次ぐ衝突事故、専門家も震撼

    フォトニュース 

  • 4
    スズキとBYD、「ジャパンモビリティショー」で軽EV市場に参入…本格的な価格競争が始動か

    トレンド 

  • 5
    ランボルギーニ「マニフェスト」が描く“美学の挑戦”…電動化の時代に響くデザイン哲学の鼓動

    フォトニュース 

話題

  • 1
    【オーナー専用】ランボルギーニ「THE LOUNGE TOKYO」公開…六本木裏通りに潜む“秘密の聖域”

    フォトニュース 

  • 2
    【新型】スバルBRZ 2026年型登場 …「ピュアスポーツの原点」を現代に蘇らせる

    フォトニュース 

  • 3
    「アウディ×バイエルン」23年の絆が走り出す…RS e-tron GTが導く“電動の未来と情熱の共鳴”

    モビリティー 

  • 4
    【スバル】初の電動SUV「アンチャーテッド」登場…480キロ走行&5秒台加速の新時代へ

    フォトニュース 

  • 5
    「全然動かないんだけど!?」ドッグカフェで露わになったうちの犬の“省エネ魂”

    フォトニュース 

シェア

[cosmosfarm_share_buttons url="https://dailyview.net" title="ピッコン" align="center"]