Mistral Pixtral-12B：开源多模态视觉模型 | 三花 AI | 免费 AI 应用 | 1000+ AI 导航合集

Mistral 官推昨天通过磁力链发布了 Pixtral 12B 模型，没有解释，只有链接。不过目前该模型已经由社区上传到了：mistral-community/pixtral-12b-240910，主要关键点如下：

上面的总结来自于大佬：Vaibhav (VB) Srivastav

现在已经有了多个基于该模型演示，可以在这里找到：HuggingFace-pixtral

商业转载请联系三花微信公众号获得授权，非商业转载请注明本文出处及文章链接，您可以自由地在任何媒体以任何形式复制和分发作品，也可以修改和创作，但是分发衍生作品时必须采用相同的许可协议。

Fish Speech v1.4 最强开源中文 TTS 和音色克隆

新模型使用 70 万小时的多语言数据进行训练，支持 8 种语言的语音生成

Linfusion: 1 个 GPU，1 分钟，16K 图像

生成 512 到 16k 图片在速度和对 VRAM 要求的曲线非常的平滑