
OpenAI、AIが自らブラウザを操作する「Operator」公開--まず米国のProユーザー向け
OpenAIは現地時間1月23日、ブラウザを操作してタスクを実行できるAIエージェント「Operator」を米国のProユーザー向けに公開した。このエージェントは、ブラウザ上でウェブページの閲覧やタイピング、クリック、スクロールといった操作...続きを読む
OpenAIは、2025年1月23日にAIエージェント「Operator」を米国のProユーザー向けに公開しました。このエージェントは、ブラウザを操作して様々なタスクを自動化することができ、ユーザーの作業効率を大幅に向上させることを目的としています。
主な機能として
- タスクの自動化: フォームの記入、食料品の注文、ミームの作成など、日常的なタスクを実行可能。
- 視覚的操作: 「Computer-Using Agent(CUA)」モデルを基に、AIがグラフィカルユーザーインターフェース(GUI)を操作。
- 問題解決能力: 操作中に問題が発生した場合、AIが自動で修正を試みる。
- カスタム指示: 特定のウェブサイトに対してカスタム設定を行い、複数のタスクを同時に処理可能。
利用方法
- ユーザーは実行したいタスクをAIに説明するだけで、必要な操作を自動で進めます。
- ログインや支払い情報の入力が必要な場合、AIが手動操作を依頼する仕組みもあります。
OpenAIは、ユーザーの操作を完全にコントロールできる仕組みやデータプライバシー管理を強化しています。現在はリサーチプレビュー段階であり、今後はPro以外のユーザーにも拡大する予定です。また、APIとしての提供や、より高度なワークフローへの対応も計画されています。

