三花快讯 · 2025, 8月18日
阿里 AIDC-AI 发布 Ovis2.5:集成NaViT的多模态模型
支持任意分辨率图像直接处理不切片
阿里AIDC-AI 推出了多模态模型 Ovis2.5,提供 9B 和 2B 两种参数量版本。该模型最大亮点是搭载原生视觉变换器(NaViT),突破性地支持直接处理任意原始分辨率图像——既不需要预先切片,也无需统一缩放至固定尺寸。这种创新架构完整保留了图像中的精细像素细节和全局空间布局,特别擅长解析图表、表格等结构化视觉内容。
佬们现在就可以去 Hugging Face Space 调戏这个新模型
商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。
本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。