Ai2’s new small AI model outperforms similarly-sized models from Google, Meta | TechCrunch

Ai2's new small AI model outperforms similarly-sized models from Google, Meta | TechCrunch
'Tis the week for small AI models, it seems. Nonprofit AI research institute Ai2 on Thursday released Olmo 2 1B, a 1-bil...続きを読む
今週木曜日、非営利のAI研究機関Ai2が10億パラメータのモデル「Olmo 2 1B」をリリースしました。
このモデルは、Google、Meta、Alibabaの同規模モデルを凌駕する性能を持ち、AI開発プラットフォームHugging FaceでApache 2.0ライセンスの下で利用可能です。
Olmo 2 1Bはゼロから複製可能で、開発に使用されたコードとデータセットも提供されています。
小型モデルは大型モデルほどの性能はないものの、強力なハードウェアを必要としないため、ローエンドマシンやコンシューマー向けマシンでも利用しやすいです。最近、MicrosoftのPhi 4推論ファミリーやQwenの2.5 Omni 3Bなど、他の小型モデルも発表されています。
Olmo 2 1Bは、4兆トークンのデータセットで学習され、算術推論能力を測定するGSM8Kベンチマークや、事実の正確性を評価するTruthfulQAテストで優れたスコアを獲得しました。しかし、Ai2はこのモデルが有害なコンテンツや誤った情報を生成する可能性があるため、商用環境での使用は推奨していません。
allenai/OLMo-2-0425-1B ・ Hugging Face
https://huggingface.co/allenai/OLMo-2-0425-1B

