OpenAI发布新一代图像模型gpt-image-1.5
OpenAI今日正式推出全新图像生成模型gpt-image-1.5,明确瞄准Google Gemini体系下备受关注的Nano Banana系列,以提升在AI图像生成领域的竞争力。这一新模型将同时面向开发者和普通用户开放,并全面接管ChatGPT中的图像生成功能。

今年3月,OpenAI曾为ChatGPT的图像生成功能带来一次重大升级,新模型一经上线便迅速走红,一周内用户便在ChatGPT中生成了超过7亿张图片。随后在4月,OpenAI通过发布gpt-image-1接口,将同一代图像技术开放给开发者使用,使其能够在各类应用和服务中集成图像生成能力。
不过,在9月登场的GoogleGemini Nano Banana模型迅速抢占话题与市场,借由更强的图像生成和编辑表现,大幅拉升了Gemini的用户覆盖。Nano Banana被认为在画面质量和编辑灵活性方面全面领先gpt-image-1,并获得全球开发者的广泛采用。上个月,Google又在此基础上推出Gemini 3 Pro Image(代号Nano Banana Pro),借助Gemini在推理与现实世界知识上的优势,进一步提升生成图像的准确性与一致性。
在这样的背景下推出的gpt-image-1.5,被OpenAI视为正面对标Gemini Nano Banana系列的新一代核心产品。新模型在图像编辑的精细度、品牌Logo和人脸等关键元素的保真度方面都有明显提升,同时在理解和执行用户指令方面也更为精准。OpenAI还强调,新模型在处理图像中文字时有显著增强,尤其是在密集文本和小字号文本的清晰度与正确性上。
对开发者而言,成本优化是gpt-image-1.5的一大亮点:与上一代gpt-image-1相比,新模型在图像输入与输出的计费上便宜约20%。开发者依旧可以通过quality参数精细控制生成成本,而OpenAI声称,即便在较低质量设置下,新模型仍能保持相当强的生成效果。
面向普通用户,gpt-image-1.5已经成为ChatGPT内置图像生成体验的底层引擎。OpenAI表示,该模型可以在保持光线、构图和人物特征等细节基本不变的前提下,进行精准编辑,相较上一代实现最多4倍的性能提升,生成与编辑响应速度更快。
配合新模型,OpenAI还在ChatGPT中上线了全新的“Images”图像专区,已在移动应用和网页版同步开放。用户可在该专区中使用预设滤镜与提示词快速上手图像生成,这些预设会定期更新,以跟随最新的创意风格与流行趋势。OpenAI表示,新的图像生成模型及ChatGPT Images体验将向所有ChatGPT用户逐步推送,未来将继续围绕易用性与创作效率进行迭代。

