OpenAI发布新一代图像模型gpt-image-1.5

0 cnBeta.COM 2025-12-17 03:24:57

摘要：

OpenAI今日正式推出全新图像生成模型gpt-image-1.5，明确瞄准Google Gemini体系下备受关注的Nano Banana系列，以提升在AI图像生成领域的竞争力。这一新模型将同时面向开发者和普通用户开放，并全面接管ChatGPT中的图像生成功能。

今年3月，OpenAI曾为ChatGPT的图像生成功能带来一次重大升级，新模型一经上线便迅速走红，一周内用户便在ChatGPT中生成了超过7亿张图片。随后在4月，OpenAI通过发布gpt-image-1接口，将同一代图像技术开放给开发者使用，使其能够在各类应用和服务中集成图像生成能力。

不过，在9月登场的GoogleGemini Nano Banana模型迅速抢占话题与市场，借由更强的图像生成和编辑表现，大幅拉升了Gemini的用户覆盖。Nano Banana被认为在画面质量和编辑灵活性方面全面领先gpt-image-1，并获得全球开发者的广泛采用。上个月，Google又在此基础上推出Gemini 3 Pro Image（代号Nano Banana Pro），借助Gemini在推理与现实世界知识上的优势，进一步提升生成图像的准确性与一致性。

在这样的背景下推出的gpt-image-1.5，被OpenAI视为正面对标Gemini Nano Banana系列的新一代核心产品。新模型在图像编辑的精细度、品牌Logo和人脸等关键元素的保真度方面都有明显提升，同时在理解和执行用户指令方面也更为精准。OpenAI还强调，新模型在处理图像中文字时有显著增强，尤其是在密集文本和小字号文本的清晰度与正确性上。

对开发者而言，成本优化是gpt-image-1.5的一大亮点：与上一代gpt-image-1相比，新模型在图像输入与输出的计费上便宜约20%。开发者依旧可以通过quality参数精细控制生成成本，而OpenAI声称，即便在较低质量设置下，新模型仍能保持相当强的生成效果。

面向普通用户，gpt-image-1.5已经成为ChatGPT内置图像生成体验的底层引擎。OpenAI表示，该模型可以在保持光线、构图和人物特征等细节基本不变的前提下，进行精准编辑，相较上一代实现最多4倍的性能提升，生成与编辑响应速度更快。

配合新模型，OpenAI还在ChatGPT中上线了全新的“Images”图像专区，已在移动应用和网页版同步开放。用户可在该专区中使用预设滤镜与提示词快速上手图像生成，这些预设会定期更新，以跟随最新的创意风格与流行趋势。OpenAI表示，新的图像生成模型及ChatGPT Images体验将向所有ChatGPT用户逐步推送，未来将继续围绕易用性与创作效率进行迭代。

查看评论

今日最热

加载中...

最新资讯

今日最热