Nanonets 开源 OCR 2 系列模型：图像文档转结构化 Markdown | 三花 AI | 免费 AI 应用 | 1000+ AI 导航合集

Nanonets 发布并开源了 OCR 2 系列模型，包括 Nanonets-OCR2-Plus、Nanonets-OCR2-3B 与 Nanonets-OCR2-1.5B-exp 三个版本。该系列模型专注于将图像文档转换为结构化 Markdown，并支持视觉问答功能。

其背后是基于 Qwen2-VL 微调而来，3B 版本在超过 300 万页的混合文档上进行训练，覆盖了论文、财报、合同、病历、税表、收据、手写及多语种材料，有需要的佬可以看看。

商业转载请联系三花微信公众号获得授权，非商业转载请注明本文出处及文章链接，您可以自由地在任何媒体以任何形式复制和分发作品，也可以修改和创作，但是分发衍生作品时必须采用相同的许可协议。

谷歌 NotebookLM 视频概览支持 Nano Banana

目前仅限 Pro 用户使用未来将全面开放

微软发布首款自研图像生成模型 MAI-Image-1，LMArena 排名第九

目前只能在 LMArena 上使用