Ai2が新しいAIモデルを発表、DeepSeekの最高モデルを上回る

Ai2 says its new AI model beats one of DeepSeek’s best | TechCrunch

Ai2 says its new AI model beats one of DeepSeek's best | TechCrunch

Move over, DeepSeek. Seattle-based nonprofit AI lab Ai2 has released a benchmark-topping model called Tulu3-405B.

2025年1月30日、Ai2（アメリカの非営利AI研究所）が新しいAIモデル「Tulu3-405B」を発表しました。このモデルは、中国のAI企業DeepSeekのリーディングシステムであるDeepSeek V3を上回る性能を持つとされています。また、Tulu3-405BはOpenAIのGPT-4oに対しても特定のベンチマークで優れた結果を示しています。

オープンソース: Tulu3-405Bはオープンソースであり、全てのコンポーネントが自由に利用可能です。

パラメータ数: このモデルは4050億のパラメータを持ち、256台のGPUを並行して使用してトレーニングされました。

強化学習: 競争力のある性能を達成するために、「検証可能な報酬を伴う強化学習（RLVR）」という技術が使用されました。

ベンチマーク結果: Tulu3-405Bは、Wikipediaからの専門知識に関する質問を含むPopQAベンチマークでDeepSeek V3やGPT-4o、MetaのLlama 3.1 405Bモデルを上回りました。また、GSM8Kテストでも最高のパフォーマンスを記録しました。

Ai2のスポークスパーソンは、このモデルの発表がアメリカのオープンAI開発における重要な瞬間であると述べています。Tulu3-405Bは、AI開発の未来を示す強力な代替手段として位置付けられています。

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31