
“複雑な思考ができるAI”、ELYZAが公開 性能は「o1-mini」に匹敵、商用利用も可能 「非リーズニングモデルから開発」
東大発のAIベンチャーELYZAは、新たなAIモデル「ELYZA-Thinking-1.0-Qwen-32B」を公開した。米OpenAIのAIモデル「o1」「o3」シリーズのような、推論性能に優れているのが特徴だ。
2025年5月1日、東京大学発のAIベンチャーELYZAが新しいAIモデル「ELYZA-Thinking-1.0-Qwen-32B」を公開しました。
中国のAlibabaが開発した非推論モデル「Qwen2.5-32B-Instruct」に対して、日本語の追加事前学習と教師ありファインチューニング(SFT)を行い、日本語での論理的思考能力を向上させています。
既存の高度な論理的思考能力を持つモデルに対して日本語の追加学習を行うのではなく、非リーズニングモデルに新たな能力を付与しました。
このモデルは、米OpenAIの「o1-mini」と同等の性能を持ち、Apache 2.0ライセンスで公開しており、商用利用が可能です。
特に、思考を連鎖的に繋げる「CoT」(思考連鎖)手法を活用し、日本語の追加事前学習と教師ありファインチューニングを行うことで、日本語での論理的思考能力を向上させています。
320億のパラメータを持ち、数学系のベンチマークで高い性能を示しています。また、ショートカットモデルも公開されており、こちらは推論した回答を記憶し、即座に利用者の質問に答えることができます。この新しいAIモデルは、さまざまな分野での応用が期待されています。
elyza/ELYZA-Thinking-1.0-Qwen-32B ・ Hugging Face
https://huggingface.co/elyza/ELYZA-Thinking-1.0-Qwen-32B

