VITA-1.5：开源多模态视频语音大模型 | 三花 AI | 免费 AI 应用 | 1000+ AI 导航合集

VITA-1.5 是一个开源的多模态视频语音大模型，类似于 GPT-4o，支持实时视频语音交互。它基于 Qwen2.5 模型，具备随时打断的功能。演示视频效果不错，值得一看。佬们可以在VITA-1.5 GitHub 仓库了解更多。

商业转载请联系三花微信公众号获得授权，非商业转载请注明本文出处及文章链接，您可以自由地在任何媒体以任何形式复制和分发作品，也可以修改和创作，但是分发衍生作品时必须采用相同的许可协议。

lmsys 文生图竞技场：Recraft V3 领跑

Midjourney 和国内模型尚未收录

OpenAI CEO Sam Altman 预测：2025 年 AI 代理将加入劳动力市场

OpenAI Pro 订阅服务目前亏损严重