Mistralは、あらゆるPDF文書をAI対応のMarkdownファイルに変換する新しいAPIを追加 | TechCrunch

Mistral adds a new API that turns any PDF document into an AI-ready Markdown file | TechCrunch

Mistral adds a new API that turns any PDF document into an AI-ready Markdown file | TechCrunch
On Thursday French large language model (LLM) developer Mistral launched a new API for developers who handle complex PDF...続きを読む

Mistralは、2025年3月6日に新しい光学文字認識(OCR)API「Mistral OCR」を発表しました。このAPIは、PDF文書をAIが利用しやすいテキストファイルに変換することを目的としています。特に、複雑なPDF文書を扱う開発者向けに設計されており、マルチモーダル機能を備えているため、テキストとともに画像やイラストを認識し、出力にバウンディングボックスを追加することができます。

Mistral OCRは、出力をMarkdown形式で提供するため、開発者がリンクや見出しなどのフォーマットを簡単に追加できるようになっています。これは、AIモデルがトレーニングデータセットとしてMarkdownを多く利用するため、特に重要です。Mistralの共同創設者であるギヨーム・ランプルは、このAPIが企業の内部文書へのアクセスを簡素化し、AIアシスタントの普及を促進する重要なステップであると述べています。

このAPIは、MistralのAPIプラットフォームやAWS、Azure、Google Cloud Vertexなどのクラウドパートナーを通じて利用可能で、機密データを扱う企業向けにはオンプレミスでの導入も提供されています。Mistralは、GoogleやMicrosoft、OpenAIのAPIよりも優れた性能を発揮すると主張しており、特に数式や高度なレイアウトを含む文書に対して効果的です。

Mistral OCRは、法律事務所などが大量の文書を迅速に処理するための利用が期待されており、企業や開発者がRAG(Retrieval-Augmented Generation)システムと組み合わせて使用することが想定されています。これにより、マルチモーダル文書をAIモデルの入力として活用することが可能になります。

Translate »
タイトルとURLをコピーしました