OpenAI图像新模型带来4倍速、降价20% 但还是输给谷歌

参数依旧华丽，但体验真的能打吗？在谷歌Nano Banana的步步紧逼下，高傲的OpenAI最终不得不选择了“自降身价”。新版GPT-Image-1.5的上线，虽然打出了4倍生成极速和“像素级”控制的王炸，更直接祭出了API端降价20%的肉搏战术，但这一切难掩其防御姿态的仓促。

舆论场瞬间撕裂。务实派大赞其“画质出色、控制精准，适用于实际生产”，认为这是工作流的福音；但权威专家却冷冷地泼下一盆冷水：“在处理复杂视觉内容时，其表现可能仍不及竞品Nano Banana Pro。”

也有评论员尖锐地指出：当OpenAI试图用“军备竞赛”的方式回应竞争，它是否已经忘记了当初那个誓言要造出AGI的初心？当科技巨头们不再讲故事，而是专注于“堆料”和“降价”时，这究竟是技术的进步，还是创新精神的沦陷？

带着这些疑问，让我们剥开GPT-Image-1.5华丽的速度外衣，它到底强在哪里？又有哪些“隐形短板”仍旧困扰着这位视觉霸主？

（GPT-Image-1.5生成效果）

1. 硬核评测：速度狂飙4倍，从“佛系等待”到“实时反馈”

ChatGPT Images这次的产品策略非常清晰：用极致的速度和精准的控制力，直击专业级用户对效率与可控性的痛点。

（图片由AI生成）

——“极速”能力的质变：创作工作流的福音

如果你是重度创作者或营销人员，那么GPT-Image-1.5在速度上的进化，无疑将成为你眼中的绝对主角。

官方数据显示，新模型的生成速度最高直接飙升至原先的4倍！有网友评论称，这是“自从Nano Banana发布以来，AI图像生成领域在模型排名上最大的飞跃！”

在追求实时交互和高效迭代的今天，这种速度的革命性意义在于：

· 并行创作：用户可以在已有图像生成的同时，继续发起新的创作请求，彻底消除“等待时间”。

· 降低试错成本：以前需要数分钟的尝试，现在可以在几十秒内完成多轮迭代，极大地提高了“试错效率”。

这种速度的提升，使得图像生成从“被动等待”转向了近乎 “实时反馈”，为工作流的整合奠定了坚实的基础。

——独立创作空间：用户体验的颠覆性重构

为了配合这种高速迭代的需求，OpenAI推出了独立的Images创作空间，不再让图像功能仅仅是聊天窗口中的“附属功能”。

（图片由AI生成）

这个专属的“创意工作室”内置了多种预设滤镜、持续更新的流行提示词趋势以及创意模板。此外，用户还可以一次性上传个人形象（肖像），用于后续重复创作，从而降低了重复描述的成本。正如OpenAI应用负责人菲吉·西莫所说，新界面旨在让图像生成过程充满乐趣，使创意探索变得毫不费力。

——“精确编辑”的强悍实力：告别整体漂移

在具体的编辑应用场景中，GPT-Image-1.5也有质的飞跃：

（图片由AI生成）

· 一致性保持（核心）：它能更准确地区分图像中 “需要改变的部分” 与 “应当保持不变的部分”，并在内部推理中“钉死”关键的视觉锚点。例如，你可以给人物换服装、换发型，而人物的五官、面部特征和光照条件依然纹丝不动，大大提升了“试穿试戴”和“角色一致性”的实用价值。

· 指令遵循与文本渲染：模型在理解多约束、复杂组合要求时的稳定性有所提升。同时，它在文字渲染方面实现了进一步增强，能够更清晰地呈现密集文本与小字号内容，被视为图像模型“迈向实用化”的必要补课。

世界顶尖免疫学家德里亚·乌努特马兹（Derya Unutmaz）用“惊艳”来形容使用体验，特别称赞了ChatGPT Images在指令执行的精准度和图像编辑的细致程度上的出色表现。

2. 深度挖掘：光鲜背后的“隐形短板”与行业焦虑

但我们不能只看官方秀出的肌肉。在GPT-Image-1.5耀眼的参数之下，也有一些值得警惕的短板和行业焦虑。

——技术“护城河”的消失与GPT-Image-1.5的定位

这是奥特曼“红色警报”的核心原因之一。虽然OpenAI宣称GPT-Image-1.5在一致性方面有所突破，但行业现状是：差距已经微乎其微。

（图片由AI生成）

谷歌Nano Banana Pro在精确编辑、背景移除等方面一直领先。Runway在视频生成领域甚至反超了Sora。

有网友评论称，将版本号定为1.5而非2.0，本身就暗示了OpenAI的谨慎态度：这是一次重要迭代而非代际革命。

曾经，OpenAI领先对手一年甚至两年；现在，这个领先优势被压缩到了几周甚至几天。图像生成的底层范式已经成为行业共识，OpenAI不再拥有独门秘籍。

——复杂构图与结构化设计的挑战

尽管模型在保持核心要素一致性上表现出色，但在面对复杂和结构化任务时，挑战依然存在。

（图片由AI生成）

沃顿商学院教授伊桑·莫利克（Ethan Mollick）认为，在处理复杂视觉内容（如多图幻灯片、信息图表等结构化设计）时，ChatGPT Images的表现可能仍不及竞品Nano Banana Pro。

前OpenAI研究员迈尔斯·布伦迪奇（Miles Brundage）则吐槽道，当提示词过长或过于复杂时，ChatGPT Images可能无法完全理解并协调所有细节，导致输出结果看起来随机或不准确。

这说明，模型在“抽象理解”和“多元素逻辑协调”上，仍未达到完美状态。

——降本增效：商业突围的布局

这次升级也是一场精明的商业突围。

GPT-Image-1.5已通过API形式正式开放，其最大的亮点在于：图像输入与输出的整体成本降低了约20%！ API定价为每百万输入Token 8美元、每百万输出Token 32美元。

（图片由AI生成）

这对于预算有限的初创公司和电商企业来说，无疑是极大的利好。Wix、Canva等头部企业已开始集成该模型。

正如Wix AI研究与数据科学负责人希拉·加特（Hila Gat）所言，GPT Image 1.5画质出色、控制精准，能准确执行编辑指令，支持端到端迭代，适用于实际生产。

3. 结语：视觉时代的“王座守卫战”与创作自由的未来

GPT-Image-1.5的双重进化——速度狂飙与精度锁定——再次向世界证明了 OpenAI在 AI基础设施上的统治力。它不再满足于当一个偶尔灵光乍现的“艺术家”，而是立志成为每一个创意工作者案头的“数字版Photoshop”。

但面对谷歌、Anthropic 等巨头的步步紧逼，当所有模型都在逼近人类专家的水准时，“第一”的头衔将变得越来越昂贵、也越来越脆弱。

OpenAI 的真正考验，不再是能否跑赢对手，而是能否跨越自己设置的“商业化”门槛。

这场图像能力的升级，本质上是 Open AI 为抢占 B 端市场、为未来高昂的算力支出买单而打出的一张效率牌和成本牌。它为用户带来了前所未有的创作自由，但同时也将 AI 竞赛推向了新的维度：谁能将顶尖的能力，以最低的成本、最无缝的方式融入到企业和个人的每一个工作流程中，谁才是真正的胜利者。

（图片由AI生成）

而对于用户而言，巨头们的“军备竞赛”却是最大的福音。更强的模型、更低的价格、更顺手的工具——这就是竞争带来的红利。至于 GPT-Image-1.5能否真正终结比赛，答案不在参数表里，而在每一个创作者的鼠标和键盘之上。