
DeepSeekはどのようにしてOpenAIの3%のコストでo1を超えたのか?
中国のAI企業・DeepSeekが2025年1月にリリースしたオープンソースモデル「DeepSeek R1」はAI業界に衝撃をもたらし、そのインパクトは株式市場をも揺るがしています。特に注目されているR1のコストパフォーマンスについて、IT...続きを読む
DeepSeekは、2025年1月にリリースしたオープンソースモデル「DeepSeek R1」により、AI業界に大きな影響を与えています。このモデルは、OpenAIのo1と比較して、わずか3%のコストで運用できることが特徴です。以下に、DeepSeek R1の主なポイントをまとめます。
コストパフォーマンス
- OpenAI o1のコスト:
- 100万入力トークンあたり15ドル
- 100万出力トークンあたり60ドル
- DeepSeek R1のコスト:
- 100万入力トークンあたり0.55ドル
- 100万出力トークンあたり2.19ドル
- R1はo1の約3.6%のコストで運用可能です。
技術的アプローチ
- R1は「純粋な強化学習」に基づいており、従来の教師あり微調整(SFT)をほとんど使用していません。このアプローチにより、モデルは複雑な問題に対して追加の処理時間を割り当て、タスクを優先順位付けする能力を発展させました。
- 研究者はこの現象を「アハ体験」と呼んでいます。
開発リソース
- DeepSeekは、5万枚のNVIDIA製GPUを使用しており、これはOpenAIやGoogleなどの大手が使用する50万枚以上に比べて少ないですが、限られたリソースで競争力のある結果を出しています。
オープンソースの利点
- R1はオープンウェイトモデルであり、デフォルトで思考の連鎖(CoT)を透過的に表示します。これにより、他のオープンソースモデルと比較しても注目されています。
倫理的な問題
- R1は、天安門事件や台湾、ウイグル族に関する質問に答えないなどの倫理的なバイアスが指摘されています。開発者はこれをエッジケースと見なし、微調整によって改善可能と考えています。
業界への影響
- DeepSeekの成功は、OpenAIやOracleが推進する「Stargate Project」との対比で、AI開発におけるコストの持続可能性に疑問を投げかけています。
DeepSeek R1の登場は、AI業界におけるコスト効率と技術革新の新たな可能性を示しており、今後の競争において重要な役割を果たすことが期待されています。

