三花快讯
一觉醒来看三花,分分钟 Get 全网 AI 动态
2025, 9月12日
剪映国际版 CapCut 正式推出完整版 CapCut AI Suite,定位为「相机 + 智能体」。
用户只需输入提示词,就能快速生成视频、图像和音乐,轻松搞定内容创作全流程。
不过目前仅对部分地区开放,更多细节还请查看CapCut 官网详细介绍
海螺 AI 正式推出新一代音乐生成模型MiniMax Music 1.5,可生成最长 4 分钟的完整歌曲,现面向全球开发者开放 API。
虽然官方没放基准测试对比,但实际效果听起来确实不错,API 单曲低至 $0.03,有需要的佬们可以冲了!
百宝箱 Tbox 是蚂蚁集团推出的通用 Agent 产品,支持多智能体协同工作,能自动拆解复杂任务并分配给不同角色并行处理。
官网还提供了智能体开发平台和开放能力,同时上线了企业版解决方案,有需要的佬们可以仔细瞅瞅
阿里 Qwen 团队发布了Qwen3-Next 模型架构,并推出了 Qwen3-Next-80B-A3B 模型。这款模型拥有 800 亿总参数但仅激活 30 亿参数,该Base模型实现了与Qwen3-32B dense模型相近甚至略好的性能,而它的训练成本(GPU hours) 仅为Qwen3-32B的十分之一不到,在32k以上的上下文下的推理吞吐则是Qwen3-32B的十倍以上,实现了极致的训练和推理性价比。
Qwen3-Next 系列模型已经在 Hugging Face 和 ModelScope 平台开源了,佬们可以直接通过 Qwen Chat 或阿里云百炼进行调用体验。
Cursor 宣布其新 Tab 模型现作为编辑器默认选项,与上一代相比,建议数量减少 21%,同时接受率提升 28%。更多细节,佬们可以查看官方博客
Genspark AI 浏览器正式上线,支持端侧运行 AI 模型,无需联网即可调用 169 款开源模型权重(含 GPT-OSS、Gemma3 等)。官方承诺永久免费、零成本且隐私零泄露。
但看似零门槛的背后,实则需要一台能跑动大模型的设备——毕竟本地运算的算力成本可不会凭空消失!
字节开源的 HuMo 是一个 170 亿参数的多模态视频生成框架,专门针对人体视频生成进行了优化。它支持文本、图像、音频三种模态的协同输入,能够生成 480P 与 720P 分辨率、最长 97 帧、25FPS 的精细可控人物视频。
目前代码与模型权重已在 HuggingFace 上发布,不过暂时没有提供在线演示,佬们可以关注我,为你持续跟进最新进展。
2025, 9月11日
NotebookLM 企业版现已开放 API,支持对笔记本进行创建、读取、共享和数据源管理等操作。