Google DeepMindのAeneasモデルは断片化されたラテン語のテキストを復元 – engadget.com

Google DeepMind’s Aeneas model can restore fragmented Latin text – engadget.com

Google DeepMind's Aeneas model can restore fragmented Latin text
Augustus said what?!

Google DeepMindが開発したAeneasモデルは、古代のラテン語の断片的なテキストを復元し、文脈を理解するためのAIツールです。このモデルは、古代ローマの英雄アエネアスにちなんで名付けられ、オープンソースで無料で利用可能です。

古代ローマには多くの碑文が残されていますが、これらのテキストはしばしば断片的で、風化や損傷が見られます。Aeneasは、これらの欠落部分を再構築するために、文脈的な手がかりを利用するアルゴリズムを使用しています。

Aeneasは、歴史家が最も困難な作業の一つである「類似テキストの特定」を迅速化します。具体的には、言葉遣いや文法、地域によって整理された類似のテキストを見つけ出すことができます。

DeepMindによると、このモデルは数千のラテン語の碑文を分析し、数秒で類似テキストを取得することが可能です。Aeneasは、各テキストを「歴史的指紋」として扱い、深い関連性を特定することで、歴史家が碑文をより広い歴史的文脈に位置づける手助けをします。

特にAeneasの優れた点は、未知の長さのテキストのギャップを復元できることです。これは、クロスワードパズルのように、各手がかりの文字数が不明な状態で埋めていく作業に似ています。

また、このツールはテキストと視覚的な入力の両方を分析できるマルチモーダルな特性を持ち、テキストの出所を特定するためにこの多面的なアプローチを使用する初のモデルです。

Aeneasは、歴史家の既存の作業フローにおける協力的なパートナーとして設計されており、研究者にとっての出発点となる「解釈可能な提案」を提供するのに最適です。

実際にこのモデルを試した歴史家は、「Aeneasの類似テキストは、碑文の復元や年代の特定において重要な違いをもたらした」と述べています。

さらに、Aeneasのリリースに合わせて、DeepMindは古代ギリシャのテキスト用のモデル「Ithaca」もアップグレードしました。

IthacaはAeneasの能力を活用し、文脈的な復元機能を強化しています。研究者は、DeepMindの「Predicting the Past」ウェブサイトでAeneasを試すことができ、モデルのコードとデータセットもオープンソースとして公開されています。

Aeneas transforms how historians connect the past – Google DeepMind
https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/
GitHub – google-deepmind/predictingthepast
https://github.com/google-deepmind/predictingthepast

Translate »
タイトルとURLをコピーしました