話題の中華LLM「DeepSeek R1」の日本語追加学習モデル サイバーエージェントが無料公開 – ITmedia AI+

話題の中華LLM「DeepSeek R1」の日本語追加学習モデル サイバーエージェントが無料公開
サイバーエージェントは、大規模言語モデル(LLM)「DeepSeek-R1」を使った新たなAIモデルを公開した。

サイバーエージェントは1月27日、大規模言語モデル(LLM)「DeepSeek-R1」を使った新たなAIモデルを無料公開した。
「DeepSeek-R1-Distill-Qwen-14B/32B」をベースに、日本語を追加学習させたLLM「DeepSeek-R1-Distill-Qwen-14B/32B-Japanese」をHugging Face上で公開。ライセンスは、MITライセンスで商用利用なども可能だ。

Hugging Face DeepSeek-R1-Distill-Qwen-32B-Japanese
https://huggingface.co/cyberagent/DeepSeek-R1-Distill-Qwen-32B-Japanese

Translate »
タイトルとURLをコピーしました