Ai2 says its new AI model beats one of DeepSeek’s best | TechCrunch

Ai2 says its new AI model beats one of DeepSeek's best | TechCrunch
Move over, DeepSeek. Seattle-based nonprofit AI lab Ai2 has released a benchmark-topping model called Tulu3-405B.
2025年1月30日、Ai2(アメリカの非営利AI研究所)が新しいAIモデル「Tulu3-405B」を発表しました。このモデルは、中国のAI企業DeepSeekのリーディングシステムであるDeepSeek V3を上回る性能を持つとされています。また、Tulu3-405BはOpenAIのGPT-4oに対しても特定のベンチマークで優れた結果を示しています。
- オープンソース: Tulu3-405Bはオープンソースであり、全てのコンポーネントが自由に利用可能です。
- パラメータ数: このモデルは4050億のパラメータを持ち、256台のGPUを並行して使用してトレーニングされました。
- 強化学習: 競争力のある性能を達成するために、「検証可能な報酬を伴う強化学習(RLVR)」という技術が使用されました。
- ベンチマーク結果: Tulu3-405Bは、Wikipediaからの専門知識に関する質問を含むPopQAベンチマークでDeepSeek V3やGPT-4o、MetaのLlama 3.1 405Bモデルを上回りました。また、GSM8Kテストでも最高のパフォーマンスを記録しました。
Ai2のスポークスパーソンは、このモデルの発表がアメリカのオープンAI開発における重要な瞬間であると述べています。Tulu3-405Bは、AI開発の未来を示す強力な代替手段として位置付けられています。
コメント