三花快讯

搜索...

一觉醒来看三花,分分钟 Get 全网 AI 动态

2025, 9月12日

9月12日

剪映国际版 CapCut 正式推出完整版 CapCut AI Suite,定位为「相机 + 智能体」。

用户只需输入提示词,就能快速生成视频、图像和音乐,轻松搞定内容创作全流程。

不过目前仅对部分地区开放,更多细节还请查看CapCut 官网详细介绍

海螺 AI 正式推出新一代音乐生成模型MiniMax Music 1.5,可生成最长 4 分钟的完整歌曲,现面向全球开发者开放 API。

虽然官方没放基准测试对比,但实际效果听起来确实不错,API 单曲低至 $0.03,有需要的佬们可以冲了!

百宝箱 Tbox 是蚂蚁集团推出的通用 Agent 产品,支持多智能体协同工作,能自动拆解复杂任务并分配给不同角色并行处理。

官网还提供了智能体开发平台和开放能力,同时上线了企业版解决方案,有需要的佬们可以仔细瞅瞅

阿里 Qwen 团队发布了Qwen3-Next 模型架构,并推出了 Qwen3-Next-80B-A3B 模型。这款模型拥有 800 亿总参数但仅激活 30 亿参数,该Base模型实现了与Qwen3-32B dense模型相近甚至略好的性能,而它的训练成本(GPU hours) 仅为Qwen3-32B的十分之一不到,在32k以上的上下文下的推理吞吐则是Qwen3-32B的十倍以上,实现了极致的训练和推理性价比。

Qwen3-Next 系列模型已经在 Hugging Face 和 ModelScope 平台开源了,佬们可以直接通过 Qwen Chat 或阿里云百炼进行调用体验。

Cursor 宣布其新 Tab 模型现作为编辑器默认选项,与上一代相比,建议数量减少 21%,同时接受率提升 28%。更多细节,佬们可以查看官方博客

Genspark AI 浏览器正式上线,支持端侧运行 AI 模型,无需联网即可调用 169 款开源模型权重(含 GPT-OSS、Gemma3 等)。官方承诺永久免费、零成本且隐私零泄露。

但看似零门槛的背后,实则需要一台能跑动大模型的设备——毕竟本地运算的算力成本可不会凭空消失!

即梦 AI 开启 7 天限时免费活动,期间所有用户均可免费使用包括 Seedream 4.0 在内的全部图像生成模型。

此外,官方还贴心地提供了非常详细的提示词手册,佬们可以趁机学习学习。

字节开源的 HuMo 是一个 170 亿参数的多模态视频生成框架,专门针对人体视频生成进行了优化。它支持文本、图像、音频三种模态的协同输入,能够生成 480P 与 720P 分辨率、最长 97 帧、25FPS 的精细可控人物视频。

目前代码与模型权重已在 HuggingFace 上发布,不过暂时没有提供在线演示,佬们可以关注我,为你持续跟进最新进展。

2025, 9月11日

9月11日

ChatGPT 面向 Pro 用户与 Plus 用户推出开发者模式,启用后支持添加任意自定义 MCP 服务器,支持协议包括 SSE 与流式 HTTP。完整功能介绍可以查看官方文档

NotebookLM 企业版现已开放 API,支持对笔记本进行创建、读取、共享和数据源管理等操作。