
オープンAIは17日(現地時間)、ユーザーに代わってオンラインで業務を処理し、複雑なタスクを自動化するAI機能「ChatGPTエージェント」を正式に公開した。この機能は単なる検索を超え、文書作成、プレゼンテーション制作、レストラン予約など、日常生活の多様なタスクを1つのエージェントで処理できるよう設計されている。
今回公開された「ChatGPTエージェント」は、既に発表済みの「オペレーター(Operator)」と「ディープリサーチ(Deep Research)」を統合した製品だ。「オペレーター」はユーザーに代わって旅行予約や食事注文など実行中心の業務を行い、「ディープリサーチ」は複数のウェブサイトから情報を収集し、専門的な分析レポートを作成する機能を持つ。
今回公開されたエージェントは両機能の利点を組み合わせ、ウェブページの閲覧、クリック、スクロール、テキスト入力などの視覚的インターフェース操作はもちろん、コード実行、ファイル生成、分析、API呼び出し、カレンダー連携まで可能だ。
オープンAI側は「ChatGPTエージェントはインターネット上の多数のウェブページを迅速に読み取り調査でき、実際のウェブサイトインターフェースを直接操作してタスクを遂行する」と述べ、「ユーザーのスケジュールに合わせてレストラン予約も行える」と説明した。
実際の試演では、「エヌビディアの四半期決算に関するプレゼン資料を作成して」という要請に対し、ウェブ検索で関連文書と画像を収集し、画像生成APIを活用してプレゼンファイルを自動生成した。また、「火曜から木曜の午後6時〜9時30分の間の予定を確認し、オープンテーブルでイタリア料理か韓国料理店を予約して」という要請に対しても、Googleカレンダーと連携して自動予約を行う様子が試演された。
「ChatGPTエージェント」は、ChatGPTのウェブサイトで「エージェントモード」を選択するか「agent」と入力することで利用可能だ。現在、ChatGPTプロ、プラス、チーム契約ユーザーに順次提供されており、欧州経済領域(EEA)とスイスを除くほとんどの国で利用できる。
オープンAIは、今回のエージェントが金融取引や法律相談など高リスクの作業を制限し、機密性の高い業務の前には必ずユーザーの同意を求めるなど、既存モデルの中で最も強力な安全対策を備えていると強調した。
注目の記事