Mini-Gemini 视觉语言模型 | 三花 AI | 免费 AI 应用 | 1000+ AI 导航合集

Mini-Gemini 视觉语言模型，更好地理解图像、进行推理和生成内容，以弥补 OS VLMs 和像GPT4等模型之间的差距。它支持2B to 34B的密集和MoE大型语言模型，并且在一些测试中表现不错。

Demo:https://huggingface.co/spaces/wcy1122/MGM
GitHub：https://github.com/gradio-app/gradio/

商业转载请联系三花微信公众号获得授权，非商业转载请注明本文出处及文章链接，您可以自由地在任何媒体以任何形式复制和分发作品，也可以修改和创作，但是分发衍生作品时必须采用相同的许可协议。

NVIDIA TeSMo：文本控制场景感知运动

NVIDIA 推出 TeSMo , 它是一种文本控制的场景感知运动生成方法，根据文本指令生成场景中人物的动作。

苹果发布AI语言模型和训练库

OpenELM Pretrained Models 一组小型（270M-3B）且高效的AI语言模型