三花快讯 · 2025, 2月26日
阿里 Wan 2.1 视频模型开源
I2V-14B 型号可生成 720P 高清视频
昨天,Wan 2.1 视频模型在通义万相团队的直播中发布。这一模型支持文生成视频、图生成视频、视频编辑、文生图以及视频生音频,是首个能够同时支持生成中文和英文文本的视频模型。模型和代码基于 Apache 2.0 协议,可商用。
特别值得一提的是,其中的 I2V-14B 型号可以生成 720P 高清视频;另一个型号 T2V-1.3B 只需 8.19 GB 的显存,在 RTX 4090 上生成一段 5 秒的 480P 视频大约需要 4 分钟(未使用优化技术如量化),性能甚至可以媲美一些闭源模型。
完整内容可以查看通义万相团队的博客,当然,也可以直接看直播回放
商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。
本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。