ChatGPT负责人爆4o复活内幕：过快下线是失误，将迭代模型人格

0 新智元 2025-09-18 11:27:19

摘要：

“还我GPT-4o！”GPT-5发布后不到一周，在用户强大的反对声浪中，OpenAI不得不火速宣布GPT-4o等前代模型回归。至此，大家才意识到：用户对4o等上一代模型，已经产生了深深的“依恋感”。下线4o，已经不再是产品升级那么简单了，更像是忽然从用户身边带走了一位熟人或伙伴。

尤其是对于深度用户来说，这一点更为明显。他们很多都是4o等前代模型的忠实拥趸，反弹情绪也更为强烈。

这一点令Altman，以及一直领导ChatGPT开发的Nick Turle都始料未及。

于是，便有了GPT-4o的火速回归。

事实上，GPT-5的发布会，给了OpenAI一个很好的反思产品的机会。

一周之后，Nick Turley在《The Verge》编辑Alex Heath的采访中，深度复盘了GPT-5发布后面临的用户差评风波，以及他的一些思考。

对谈中，Nick详细总结了GPT-5发布的一些失误，比如：

过快下线GPT-4o、低估用户会对模型的情感依恋、用一个模型适用所有用户、没有让用户建立起“可预期性”等。

Nick表示，OpenAI已经认识到持续迭代模型人格的重要性，并提到通过一个Model Behavior的团队来推动这项工作。

同时，Nick也分享了OpenAI的产品设计哲学，是帮用户解决长期问题、达成长期目标，而不是让用户尽可能留在产品里。

“真正对用户有帮助”，才是其设计产品的核心原则。

忽视用户情感

让GPT-5发布后迎意外暴击

忽视用户的“依恋感”，让GPT-5在发布不到一周后，便被网友锤爆了。

用Nick的话说，“很多意外都是写进常态的”。

但也没办法，ChatGPT现在有7亿周活用户：用户太多，千人千面，众口难调。

这搞得Nick着实头大，几天后他在接受《The Verge》采访时，仍在“消化”这次发布会所带来的影响。

他先是总结了GPT-5发布的两点失误：

Nick：第一，GPT-4o下线走得太快了，至少在过渡期没有继续提供GPT-4o；第二，低估了用户会对一个模型有如此强的情感依恋。真正的挑战，不在于产品本身的升级，而是人们对模型“人格”的强烈感受。

这两点失误，让Nick认为应当更认真地思考，如何在如此庞大的用户基础上进行产品升级和管理。

Nick表示，OpenAI已快速修正了这两点错误。

一是将原有模型重新提供给ChatGPT付费用户；二是对GPT-5的个性进行更新，上线了“选择你自己的性格”的能力。

8月13日，Altman发布了ChatGPT的更新信息，已经将4o恢复为所有付费用户的默认模型，他们可以在网页设置中切换o3、4.1、GPT-5 Thinking mini等其他模型。

Altman称在过去几天学到的一点，是真正认识到：要打造一个能够根据用户需求定制更多模型个性的世界——解决方案，就是要让更多用户能够自由定制ChatGPT的风格。

Nick提到了一个原则，要努力去理解4o身上的一些原本没有被足够认识或重视的东西，比如模型人格对用户的情感价值。在这方面，GPT-5也要向4o看齐，变得更温暖和友好一些。

实际上，Sam Altman已经在GPT-5发布后表示，在过去大约一年，OpenAI就一直在密切关注用户对GPT-4o的“依恋感”，但并没有太主流的关注。

这次发布会风波，引发了OpenAI对ChatGPT产品“模型人格”的重视，这也是一个很好的优化契机。

放弃模型选择

用一个模型适用所有用户

放弃模型选择，试图用一个模型搞定所有用户，是OpenAI在GPT-5发布上的另一个失误。

这导致了OpenAI在发布GPT-5时，没有做分阶段发布。

Alex：这个决定背后的动机是什么？是成本因素吗？

Nick：这绝对不是成本问题，而是为了追求简单，这也是ChatGPT做产品一贯的核心原则。

在Nick看来，让用户自己去搞清楚“用哪个模型回答哪个问题”，认知负担非常重。

而且在用户调查中，Nick也反复从用户那里听到：他们希望得到的是一个“产品”，不是一堆“模型”。如果OpenAI能根据问题，为他们做出合适的选择，他们会很喜欢。

Nick一直认为，大多数用户需要的是像macOS这样的产品：

既能面向大部人做到简单易用；同时，对于深度用户，他们也可以进设置、打开终端、把各种开关和参数都调起来。

同样，Nick也希望将ChatGPT做成macOS式的产品：

Nick：对于普通用户简单易用，重度用户也能按自己喜好配置一切——包括选择自己最喜欢的模型。

因此，面对重度用户，ChatGPT一直是坚持要保留所有旧模型的。

但这次的失误之处在于：他们在7亿用户基础之上，对重度用户的分布产生了误判，低估了在其他一些套餐中也存在很多重度用户——正是这些重度用户对旧模型的“依恋感”，让他们在网上掀起了反对声浪。

没有让用户建立起“可预期性”

凡是成功的产品，都有一个成功的“预期管理”。

符合或者超越用户预期，必会赢得用户追捧；违背或忽视用户预期，势必令用户唾弃。

GPT-4o的过早下线，就是踩到了违背“用户预期”的红线。

随着GPT-5，以及未来GPT-6等一系列新模型的发布，旧模型何时“退休”也被提上日程。

Alex：OpenAI对此是否有已经有了明确安排？

Nick表示，这点十分必要，而且OpenAI也在着手做这件事。但必须坚持一个重要原则：给用户一定的“可预期性”，尤其是在目前用户基数的前提下，这样做尤其重要。

Nick：关于用户的“可预期性”，在企业版里OpenAI已经这么做了。目前的做法，更像是将这一原则进一步拓展。

这也是此次发布会，OpenAI获得的一个非常明确的经验教训。

谈到4o的“退休时间”，Nick表示，目前并没有一个具体的时间表。

Nick:我们想先真正搞清楚4o擅长的地方。如果没有非要让它下线的重大理由，我很乐意把它保留下来。

为了保持用户的“可预期性”，Nick称，未来4o真的要下线，一定会提前沟通。

所以，具体怎么做，取决于我们学到了什么。

Nick：我觉得这件事需要多去倾听，这也是做 AI 非常独特的一点：你在发布之后会学到海量信息。基于这些，我们会拿出正确的方案。

模型人格与“优化哲学”

与其猜测4o何时下线，更让Nick感兴趣的问题是：

到底大家是喜欢4o本身，还是喜欢4o身上的某些具体特质？

比如，假设用户喜欢它“人格更有温度”，OpenAI也会把这个特质带到GPT-5上。

Nick称，OpenAI已经认识到持续迭代模型人格的重要性，并通过一个叫“Model Behavior”的团队来推动这项工作。

此外，还会通过Model Spec（模型行为规范文档），来帮助开发者和研究人员理解和审视模型行为，明确某些行为是设计上的有意为之，还是潜在的bug。

Nick：在未来几周甚至几个月内，还将持续迭代GPT-5的“感觉”和“行为”。这次GPT-5的发布，也为继续做这件事提供了一个好时机。

Alex Heath提到了这次4o下线后，用户在Reddit上的惊人反应：

“有人说，我一夜之间失去了朋友。这是我唯一的朋友；感觉像有人去世了；我不敢跟GPT-5说话，因为感觉像是在「出轨”；我感觉丢了那个很有同理心的同事……」

Alex：用户的反应为OpenAI带来了什么影响？为什么之前没有充分意识到，大家会有这么强烈的情感依恋？

Nick回答说，其实OpenAI内部已经关注这类现象有一段时间了。与此同时，他们也一直在担心：出现一个人们过度依赖AI的世界。

但让Nick没想到的是，人们会对某个“特定模型”产生这么强的感情——而不是对整个产品。

Nick：实际上，GPT-5已经解决了很多大家对4o的建设性反馈，甚至在整体氛围上也做了改进。但很多网友对此并不认账。

Reddit上的评论，让Nick觉得很有意思，它们显示出用户群体的极度“分化”：

Nick：有人特别爱4o，也有人强烈认为GPT-5更好，大家对自己选择的“热情程度”非常惊人。

用户的反馈，对Nick也有点“重新校准”的意味。

Nick提到，他在一两周前，曾写过一篇博客，在里面花了不少篇幅讲ChatGPT的“优化哲学”。

他非常想强调的一点是：

Nick：我们的目标，不是让用户尽可能留在产品里；相反，而是要帮用户解决长期问题、达成长期目标。这在很多时候其实意味着“在产品里花更少时间”。

所以，当Nick看到人们把GPT视作自己唯一而且最好的朋友时，这并不是他想在ChatGPT里主动营造的东西。

相反，Nick将这种“过度停留”，视作一种副作用。

比如就在8月16日，OpenAI宣布会让GPT-5由以前的过于正式，变为更加温暖和友好时，也有网友反对让GPT-5过度人格化。

如何衡量产品对用户的价值，这是一个值得认真对待和深入研究的问题，OpenAI也在这个问题上不断探索。

如何让7亿用户

可以毫不含糊地说YES

Alex Heath问了一个有关产品设计的灵魂问题：

Alex：如何平衡“产品目标”与“用户实际使用方式”之间的张力？

Nick说，当你在7亿用户的规模上运营，就不得不面对一个现实：你可以有正确而纯粹的目标，你也可以尽最大努力按照这些目标来构建产品。

在如何选择上，Nick提到了一个重要原则——“真正对用户有帮助”。

甚至，有时要说出用户可能不爱听的话。

基于这一原则，OpenAI也对产品做了一系列调整：

比如，OpenAI通过与多个国家和大量心理健康专业人士交流，理解当人们过度使用产品，或者在不太健康的状态下使用产品时，该如何处理。

并以此修改模型行为，为模型上线了“过度使用提醒”，当用户以极端频率使用ChatGPT时，它会轻轻提醒你。

Nick提到了特别重要的一点，也回应了公众对OpenAI是否会探索广告模式的猜测：

Nick：我们其实并没有任何“让你在产品里花更多时间”的特别动机；我们的商业模式非常简单：基础产品免费，如果你喜欢更多功能，就订阅。没有第二层目的。

在这一原则下，Nick也提到了检验好产品的标准，这也是他们经常给自己设的“思想实验”：

Nick：如果你认识的人正经历困难，或许刚失恋，或许对人生感到迷茫——你会不会真的、毫不犹豫、很有信心地推荐他/她使用ChatGPT？

Nick表示，对于OpenAI来说，这就是标准。他们会一直做到自己也有这种底气为止，在此之前他们不会停下来。

当然，Nick也坦言，有时这也是一道艰难的选择题。

比如，当有人向你寻求人生建议，或者陷入困境时，你完全可以很轻松地把这些用例直接关掉，对用户说：“抱歉，这个我帮不了你。”

这样做的确是条“容易的出路”，但Nick和OpenAI想要选择的，显然是那条“难而正确的”道路，就是为那些没有资源、没人可聊的人，提供一个好的产品，做到让用户“可以毫不含糊地说 YES”的程度。

GPT-5发布

伤害ChatGPT了吗

Alex：GPT-5对ChatGPT的使用有没有伤害？你们内部统计的总体数字是在上涨吗？最重度用户的使用是在下降吗？

面对Alex Heath的提问，Nick对GPT-5的表现似乎很满意：

Nick：使用和增长看起来都很不错，和我们的直觉也高度一致；我们在第2天看到API的调用量大幅增长——也就是开发者在用GPT-5搭建东西；在ChatGPT里，我们也看到了非常积极的增长。

用户分层不同，也会影响到对产品的评价，这也是为什么Nick提到，在为这么多不同的用户构建产品时，你会有点困惑：

Nick：一方面，有一小撮重度用户，我认为他们对我们如何推出GPT-5的反馈非常有道理；另一方面，还有大批更典型的普通用户，对他们来说，这可能是第一次真正看到、接触“推理模型”这一概念，以及它能带来的火花。这也会体现在我们的数据里。

正如Reddit上两级分化的用户评论，GPT-5发布时间还很短，Nick并不太想下结论，但所有指标都是偏正面的。

Nick认为，除了看数据之外，还要“待在重度用户所在的地方”，因为数据可能不足以反映他们的情绪。

Alex Heath似乎不依不饶，问：

Alex：既然整体指标不错，为什么还要把4o带回来？我推测托管就模型也会有成本。如果指标没受伤害，为什么要这么做？

Nick回答道，打造伟大产品的方式是“同时服务两端”：

Nick：一端是普通用户，比如我们的家人，他们可能离AI还比较远；另一端是极端的重度用户。二者之间“诡异的中间地带”通常不是好位置。

这也是Nick以macOS类比ChatGPT的原因：他会参考这样的产品是如何处理这一问题的。

Nick并不讳言，服务旧模型是有成本的。但他更希望能从长远投入，打造一个出色的产品。过于盯着短期指标，通常是把一个产品带向下坡路的方式。

Alex Heath提到了“模型选择”的回归，虽然他能感受到“切换模型”所造成的认知负担，但仍为此高兴。

对此，Nick回应说，会为重度用户，也就是那些可以理解模型，也愿意处理选择模型这层复杂性的用户提供“模型选择”。

但对于普通用户，则不必为“切换什么模式”费心，他们可以直接问模型问题，或者让它帮忙做事。

“我们会为90%的人保持简洁；然后为那群声音更大的重度用户提供他们想要的完整列表。这是一个兼顾两边的平衡方式。”Nick说。

这也是应对网友对GPT-5口碑两极分化的好方法。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道，更好阅读体验，更及时更新提醒，欢迎前来阅览和打赏。

查看评论

今日最热

加载中...

最新资讯

今日最热