
江戸時代の言葉を話すAIチャット「からまる」 Sakana AIが公開 古文書の2500万文字を学習
AIベンチャーのSakana AIは、江戸時代の古文風テキストで会話できるAIチャットbot「からまる」を公開した。
AIベンチャーのSakana AI(東京都港区)は4月1日、江戸時代の古文風テキストで会話できるAIチャットbot「からまる」を公開した。約2500万文字に及ぶ、江戸時代の文章で構成したデータセットを学習している。
研究と教育を目的に、HuggingFaceで公開している。約2500万文字に及ぶ江戸時代の古文書を学習しており、研究や教育を目的としています。
「からまる」は、ELYZAのオープンモデルを基にしており、江戸時代の書物から得たデータを使用しています。例えば、「あなたの名前はなんですか?」と尋ねると「某が名はからまるにて候」と返答し、現代の知識を持ちながら江戸時代の文脈で答えることができます。
大規模言語モデルの継続学習を利用することで、一貫性のある回答を実現し、従来の技術の限界を克服しています。Sakana AIは、このチャットボットが過去の文化を身近に感じるためのツールとして、広く活用されることを期待しています。
江戸時代の古文風テキストで会話できるチャットボット「からまる」を公開:過去の書物の継続学習による大規模言語モデルの開発
https://sakana.ai/karamaru/
Llama 3 Karamaru V1 – a Hugging Face Space by SakanaAI
https://huggingface.co/spaces/SakanaAI/Llama-3-Karamaru-v1

