阿里开源 ViDoRAG：多智能体系统助力视觉文档检索增强生成 | 三花 AI | 免费 AI 应用 | 1000+ AI 导航合集

ViDoRAG 是阿里开源的一个“视觉文档检索增强生成”工具，背后是一个多智能体系统，专门为理解那些既有文字又有图片的文档设计。

比起传统的检索工具，面对需要同时理解文本和视觉信息的密集文档时，传统工具容易懵圈，要么抓不住重点，要么推理能力不够，而 ViDoRAG 采用探索、总结和反思的多智能体分工协作，比传统方法强了 10% 以上。

商业转载请联系三花微信公众号获得授权，非商业转载请注明本文出处及文章链接，您可以自由地在任何媒体以任何形式复制和分发作品，也可以修改和创作，但是分发衍生作品时必须采用相同的许可协议。

xAI 的 Grok-3 以 1 分优势超越 GPT4.5 登顶大模型竞技场

Grok-3 确实好用

Wan2GP：为消费级 GPU 优化的视频生成模型

支持文生视频图生视频文生图及视频配音