OpenAIが最新推論モデル「o3-mini」を無料で提供開始 ―― STEM分野で高精度化 | XenoSpectrum

OpenAIが最新推論モデル「o3-mini」を無料で提供開始 ―― STEM分野で高精度化 | XenoSpectrum
OpenAIは、推論特化AIモデル「o3-mini」の提供を開始した。同モデルは2024年12月に予告されていた新シリーズの最新バージョンで、STEM(科学・技術・工学・数学)分野での高度な問題解決能力を持つことが特徴と ... Read ...続きを読む

OpenAIは、推論特化AIモデル「o3-mini」の提供を開始した。同モデルは2024年12月に予告されていた新シリーズの最新バージョンで、STEM(科学・技術・工学・数学)分野での高度な問題解決能力を持つことが特徴とされている。今回、OpenAIの推論モデルとしては初めて無料ユーザーにも開放されており、API価格も前世代比63%削減し、中国DeepSeekのR1モデルとの競合激化に対応している。

OpenAIの新しいo3-miniモデルは、高い性能と効率性を実現するために、「推論努力レベル」を低・中・高から選択できる新アーキテクチャを採用しています。中程度の設定では、o1-miniと比較して複雑な問題における重大なエラーを39%削減し、応答速度を24%向上させています。また、外部テスターによる評価では、o1-miniよりも56%のケースで優れた回答を提供しています。

競合との比較では、AIME 2024競技数学テストで高努力レベル設定時にDeepSeek-R1を上回り、SWE-benchソフトウェア工学ベンチマークでも優位性を示していますが、GPQA Diamondでは劣っています。コンテキストウィンドウは200,000トークンを保持し、長文処理においてDeepSeek-R1よりも優れています。

安全性に関しては、「deliberative alignment」という手法を採用し、モデルが安全性のガイドラインを深く理解することを求めています。これにより、センシティブなトピックについても適切な安全性を確保しています。コスト面では、o3-miniは入力トークンあたり0.55ドル、出力トークンあたり4.40ドルという料金体系を採用し、o1-miniと比較して63%の削減を実現していますが、DeepSeek R1よりは依然として高価です。

企業ユーザーにとっては、データセキュリティの懸念からOpenAIのサービスを選ぶ傾向があり、o3-miniはコストパフォーマンスの高い選択肢を提供することを目指しています。

コメント

Translate »
タイトルとURLをコピーしました