三花快讯 · 2025, 3月26日

OpenAI 推出了 GPT-4o 的图像生成功能

取代了此前使用的DALL-E 3模型

OpenAI 推出了 GPT-4o 的图像生成功能,它取代了此前使用的DALL-E 3模型,利用GPT-4o的原生多模态能力,能够支持渲染文本,支持从写实风格到艺术插图的多种风格,能处理复杂的用户指令,并保持一致性,还能通过多轮对话逐步调整和完善图像。

目前,该功能已集成到 ChatGPT 中,所有人都可以在对话中输入生图请求即可使用,API 将在未来几周内提供。当然这玩意不是万能的,偶尔会出现幻觉(hallucination)、数学图表生成不够准确,以及多语言文本支持有限。

更多细节和演示可以看官方介绍

商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。

本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。