三花快讯
一觉醒来看三花,分分钟 Get 全网 AI 动态
2025, 7月11日
马斯克旗下 xAI 正式发布 Grok-4 系列模型,包含标准版 Grok-4 和性能更强的 Grok-4 Heavy。据官方数据,新模型比前代 Grok-3 快 10 倍,在多项基准测试中远超 OpenAI 的 GPT-4、Anthropic 的 Claude 4 以及 Google 的 Gemini 2.5 Pro。
价格方面就比较刺激了:普通版每月 30 美元(约合 216 元人民币),而 Grok-4 Heavy 直接飙到 300 美元/月(约 2160 元)。
从社区的反馈来看,虽然官方吹得天花乱坠,但实际代码能力还不如国产的 DeepSeek-R1,倒是可以直接生成 NSFW 了
Z.ai(ChatGML)发布 GLM-Experimental 模型,免费提供 AI Slides 功能,用户可一键生成演示文稿且无使用限制。
官方透露,该功能的自托管(开源)版本已在规划中,未来任何个人或企业都能部署自己的 AI PPT 生成器,可以期待一下啊。
快手可灵 AI 发布了可图 KOLORS 2.1 图像生成模型,所有订阅用户均可限时免费使用。
不过我看了下官方,目前还是只有 2.0 、1.5、1.0 可选,可能只是预热。
Recraft AI 最新推出 MCP 服务器。
现在可以直接从 Claude 或 Cursor 来生成或修改图片,包括文生图、文生矢量图、删除背景,替换背景等等。当然 API key 还是要的,价格也比较贵。
谷歌在 Gemini App 中推出了图片转视频功能,背后基于最新的 Veo 3 视频生成模型,用户只需上传参考图像即可自动生成 8 秒的短视频。
不过这项高级功能需要订阅 Google AI Pro 服务才能使用。
2025, 7月10日
Vidu 推出升级版的“参考视频”功能,允许用户上传最多 7 张参考图像(支持人物、场景或道具),并根据用户提示智能合并这些图像以生成视频。
完整细节可以看官方推文。
谷歌开源的MCP Toolbox for Databases,能够帮助 AI Agent 实现数据库连接与操作。支持多种数据库类型及客户端接入。
NovelAI 即将开放基于 Stable Diffusion 1.5 的 NovelAI Diffusion V2 动漫模型权重!这是其官方已经弃用的模型,开放后可用于研究和非商业用途。
更多详情请参考官方博客说明。