返回上一页  首页 | cnbeta报时: 14:38:54
OpenAI图像新模型带来4倍速、降价20% 但还是输给谷歌
发布日期:2025-12-17 12:58:08  稿源:网易科技

参数依旧华丽,但体验真的能打吗?在谷歌Nano Banana的步步紧逼下,高傲的OpenAI最终不得不选择了“自降身价”。新版GPT-Image-1.5的上线,虽然打出了4倍生成极速和“像素级”控制的王炸,更直接祭出了API端降价20%的肉搏战术,但这一切难掩其防御姿态的仓促。


舆论场瞬间撕裂。务实派大赞其“画质出色、控制精准,适用于实际生产”,认为这是工作流的福音;但权威专家却冷冷地泼下一盆冷水:“在处理复杂视觉内容时,其表现可能仍不及竞品Nano Banana Pro。”

也有评论员尖锐地指出:当OpenAI试图用“军备竞赛”的方式回应竞争,它是否已经忘记了当初那个誓言要造出AGI的初心?当科技巨头们不再讲故事,而是专注于“堆料”和“降价”时,这究竟是技术的进步,还是创新精神的沦陷?

带着这些疑问,让我们剥开GPT-Image-1.5华丽的速度外衣,它到底强在哪里?又有哪些“隐形短板”仍旧困扰着这位视觉霸主?


(GPT-Image-1.5生成效果)

1. 硬核评测:速度狂飙4倍,从“佛系等待”到“实时反馈”

ChatGPT Images这次的产品策略非常清晰:用极致的速度和精准的控制力,直击专业级用户对效率与可控性的痛点。

(图片由AI生成)

——“极速”能力的质变:创作工作流的福音

如果你是重度创作者或营销人员,那么GPT-Image-1.5在速度上的进化,无疑将成为你眼中的绝对主角。

官方数据显示,新模型的生成速度最高直接飙升至原先的4倍!有网友评论称,这是“自从Nano Banana发布以来,AI图像生成领域在模型排名上最大的飞跃!”

在追求实时交互和高效迭代的今天,这种速度的革命性意义在于:

· 并行创作:用户可以在已有图像生成的同时,继续发起新的创作请求,彻底消除“等待时间”。

· 降低试错成本:以前需要数分钟的尝试,现在可以在几十秒内完成多轮迭代,极大地提高了“试错效率”。

这种速度的提升,使得图像生成从“被动等待”转向了近乎 “实时反馈”,为工作流的整合奠定了坚实的基础。

——独立创作空间:用户体验的颠覆性重构

为了配合这种高速迭代的需求,OpenAI推出了独立的Images创作空间,不再让图像功能仅仅是聊天窗口中的“附属功能”。

(图片由AI生成)

这个专属的“创意工作室”内置了多种预设滤镜、持续更新的流行提示词趋势以及创意模板。此外,用户还可以一次性上传个人形象(肖像),用于后续重复创作,从而降低了重复描述的成本。正如OpenAI应用负责人菲吉·西莫所说,新界面旨在让图像生成过程充满乐趣,使创意探索变得毫不费力。


——“精确编辑”的强悍实力:告别整体漂移

在具体的编辑应用场景中,GPT-Image-1.5也有质的飞跃:

(图片由AI生成)

· 一致性保持(核心):它能更准确地区分图像中 “需要改变的部分” 与 “应当保持不变的部分”,并在内部推理中“钉死”关键的视觉锚点。例如,你可以给人物换服装、换发型,而人物的五官、面部特征和光照条件依然纹丝不动,大大提升了“试穿试戴”和“角色一致性”的实用价值。


· 指令遵循与文本渲染:模型在理解多约束、复杂组合要求时的稳定性有所提升。同时,它在文字渲染方面实现了进一步增强,能够更清晰地呈现密集文本与小字号内容,被视为图像模型“迈向实用化”的必要补课。

世界顶尖免疫学家德里亚·乌努特马兹(Derya Unutmaz)用“惊艳”来形容使用体验,特别称赞了ChatGPT Images在指令执行的精准度和图像编辑的细致程度上的出色表现。

2. 深度挖掘:光鲜背后的“隐形短板”与行业焦虑

但我们不能只看官方秀出的肌肉。在GPT-Image-1.5耀眼的参数之下,也有一些值得警惕的短板和行业焦虑。

——技术“护城河”的消失与GPT-Image-1.5的定位

这是奥特曼“红色警报”的核心原因之一。虽然OpenAI宣称GPT-Image-1.5在一致性方面有所突破,但行业现状是:差距已经微乎其微。

(图片由AI生成)

谷歌Nano Banana Pro在精确编辑、背景移除等方面一直领先。Runway在视频生成领域甚至反超了Sora。

有网友评论称,将版本号定为1.5而非2.0,本身就暗示了OpenAI的谨慎态度:这是一次重要迭代而非代际革命。

曾经,OpenAI领先对手一年甚至两年;现在,这个领先优势被压缩到了几周甚至几天。图像生成的底层范式已经成为行业共识,OpenAI不再拥有独门秘籍。

——复杂构图与结构化设计的挑战

尽管模型在保持核心要素一致性上表现出色,但在面对复杂和结构化任务时,挑战依然存在。

(图片由AI生成)

沃顿商学院教授伊桑·莫利克(Ethan Mollick)认为,在处理复杂视觉内容(如多图幻灯片、信息图表等结构化设计)时,ChatGPT Images的表现可能仍不及竞品Nano Banana Pro。

前OpenAI研究员迈尔斯·布伦迪奇(Miles Brundage)则吐槽道,当提示词过长或过于复杂时,ChatGPT Images可能无法完全理解并协调所有细节,导致输出结果看起来随机或不准确。

这说明,模型在“抽象理解”和“多元素逻辑协调”上,仍未达到完美状态。

——降本增效:商业突围的布局

这次升级也是一场精明的商业突围。

GPT-Image-1.5已通过API形式正式开放,其最大的亮点在于:图像输入与输出的整体成本降低了约20%! API定价为每百万输入Token 8美元、每百万输出Token 32美元。

(图片由AI生成)

这对于预算有限的初创公司和电商企业来说,无疑是极大的利好。Wix、Canva等头部企业已开始集成该模型。

正如Wix AI研究与数据科学负责人希拉·加特(Hila Gat) 所言,GPT Image 1.5画质出色、控制精准,能准确执行编辑指令,支持端到端迭代,适用于实际生产。


3. 结语:视觉时代的“王座守卫战”与创作自由的未来

GPT-Image-1.5的双重进化——速度狂飙与精度锁定——再次向世界证明了 OpenAI在 AI基础设施上的统治力。它不再满足于当一个偶尔灵光乍现的“艺术家”,而是立志成为每一个创意工作者案头的“数字版Photoshop”。

但面对谷歌、Anthropic 等巨头的步步紧逼,当所有模型都在逼近人类专家的水准时,“第一”的头衔将变得越来越昂贵、也越来越脆弱。

OpenAI 的真正考验,不再是能否跑赢对手,而是能否跨越自己设置的“商业化”门槛。

这场图像能力的升级,本质上是 Open AI 为抢占 B 端市场、为未来高昂的算力支出买单而打出的一张效率牌和成本牌。它为用户带来了前所未有的创作自由,但同时也将 AI 竞赛推向了新的维度:谁能将顶尖的能力,以最低的成本、最无缝的方式融入到企业和个人的每一个工作流程中,谁才是真正的胜利者。

OpenAI新模型来了!4倍速、降价20%,网友却叹气:还是输给谷歌

(图片由AI生成)

而对于用户而言,巨头们的“军备竞赛”却是最大的福音。更强的模型、更低的价格、更顺手的工具——这就是竞争带来的红利。至于 GPT-Image-1.5能否真正终结比赛,答案不在参数表里,而在每一个创作者的鼠标和键盘之上。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道,更好阅读体验,更及时更新提醒,欢迎前来阅览和打赏。
查看网友评论   返回完整版观看

返回上一页  首页 | cnbeta报时: 14:38:54

文字版  标准版  电脑端

© 2003-2025