話題の中華LLM「DeepSeek R1」の日本語追加学習モデル　サイバーエージェントが無料公開 – ITmedia AI＋

話題の中華LLM「DeepSeek R1」の日本語追加学習モデル　サイバーエージェントが無料公開

サイバーエージェントは、大規模言語モデル（LLM）「DeepSeek-R1」を使った新たなAIモデルを公開した。

サイバーエージェントは1月27日、大規模言語モデル（LLM）「DeepSeek-R1」を使った新たなAIモデルを無料公開した。
「DeepSeek-R1-Distill-Qwen-14B/32B」をベースに、日本語を追加学習させたLLM「DeepSeek-R1-Distill-Qwen-14B/32B-Japanese」をHugging Face上で公開。ライセンスは、MITライセンスで商用利用なども可能だ。

Hugging Face DeepSeek-R1-Distill-Qwen-32B-Japanese
https://huggingface.co/cyberagent/DeepSeek-R1-Distill-Qwen-32B-Japanese

月	火	水	木	金	土	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31