
Alibaba's Qwen team releases AI models that can control PCs and phones | TechCrunch
Alibaba's Qwen team has released a new family of models, Qwen2.5-VL, that can control a PC and phone, plus handle other ...続きを読む
AlibabaのQwenチームがPCやスマートフォンを制御できるAIモデルを発表しました。
この新しいモデル群「Qwen2.5-VL」は、テキストや画像の分析、ファイルの解析、動画の理解、画像内の物体のカウントなど、さまざまなタスクを実行できます。特に、Qwen2.5-VLはOpenAIの最新モデルと比較して、動画理解や数学、文書分析、質問応答の評価で優れた性能を示しています。
主な特徴
- 多機能性: Qwen2.5-VLは、チャートやグラフィックの分析、請求書やフォームのスキャンからのデータ抽出、数時間にわたる動画の理解が可能です。
- ソフトウェアとのインタラクション: モデルはPCやモバイルデバイス上のアプリを操作でき、実際にBooking.comアプリを起動してフライトを予約するデモも行われました。
- 制限事項: 中国の規制により、特定のトピックに関しては応答を拒否することがあります。例えば、政治的な話題に関してはエラーメッセージが表示されることがあります。
モデルのバリエーション
- Qwen2.5-VL-72B: フラッグシップモデルで、商業利用には特別なライセンスが必要。
- Qwen2.5-VL-3BおよびQwen2.5-VL-7B: より小型で簡素なモデルで、許可の下で利用可能。
この新しいAIモデルは、特にマルチモーダルなタスクにおいて競争力を持っており、今後の技術開発において重要な役割を果たす可能性があります。
Alibaba’s Qwen Chat
https://chat.qwenlm.ai/
Huggingface Qwen2.5-VL – a Qwen Collection
https://huggingface.co/collections/Qwen/qwen25-vl-6795ffac22b334a837c0f9a5

